Scrapy 定义一个项目

项目是用于收集从网站报废的数据的容器。你必须通过定义你的物品来启动你的蜘蛛。要定义项目,请编辑在 first_scrapy (自定义目录)目录下找到的 items.py 文件。该 items.py 看起来如下:

import scrapy  

class First_scrapyItem(scrapy.Item):
   # define the fields for your item here like:
      # name = scrapy.Field()

MyItem 类从继承 项目 包含了许多Scrapy已建成为我们预先定义的对象。例如,如果要从网站中提取名称,网址和说明,则需要为这三个属性中的每一个定义字段。

因此,我们添加我们想要收集的项目:

from scrapy.item import Item, Field  

class First_scrapyItem(scrapy.Item):
   name = scrapy.Field()
   url = scrapy.Field()
   desc = scrapy.Field()