• scrapy框架问题报错?
  • python
    5.00元

import scrapy
import bs4
from ..items import DoubanItem

需要引用DoubanItem,它在items里面。因为是items在top250.py的上一级目录,所以要用..items,这是一个固定用法。

class DoubanSpider(scrapy.Spider): #定义一个爬虫类DoubanSpider
name = 'douban'
allower_domains = ['book.douban.com'] #定义允许爬虫爬取的网址域名
start_urls = []
for x in range(3):
url = 'https://book.douban.com/top250?start=' + str(x * 25) #定义起始网址
start_urls.append(url)

def parse(self,response):
#parse是默认处理response的方法。
   bs = bs4.BeautifulSoup(response.text,'html.parse')
   #用BeautifulSoup解析response。
   datas = bs.find_all('tr',class_="item")
   #用find_all提取<tr class="item">元素,这个元素里含有书籍信息。
   for data in datas:
   #遍历data。
       item = doubanItem()
       #实例化DoubanItem这个类。
       item['title'] = data.find_all('a')[1]['title']
       #提取出书名,并把这个数据放回DoubanItem类的title属性里。
       item['publish'] = data.find('p',class_='pl').text
       #提取出出版信息,并把这个数据放回DoubanItem类的publish里。
       item['score'] = data.find('span',class_='rating_nums').text
       #提取出评分,并把这个数据放回DoubanItem类的score属性里。
       print(item['title'])
       #打印书名。
       yield item
       #yield item是把获得的item传递给引擎。



   Traceback (most recent call last):

File "D:\hello-world.py\pythoncode\douban\douban\spiders\top250.py", line 3, in 
from ..items import DoubanItem
ValueError: attempted relative import beyond top-level package

网上的办法试了几种都w'x,不知道是我搞错了还是什么问题,求解!!!


  • 旺盛的绿萝    2020-03-23 10:16:21
  • 阅读 1760    收藏 0    回答 1
  • 邀请
  • 收藏
  • 分享
发送
登录 后发表评论
  • 51testing软件测试圈微信