python - 用scrapy爬取网站内容时，如何忽略某些内容为空的值；

Question

我爬取京东上所有手机信息时会碰到如下问题：1、返回值过多，如下图片所示： 2、spider代码如下： -- coding: utf-8 -- import scrapyfrom scrapy.http import Requestfrom ueinfo.items import UeinfoItem class...

漂亮男人 · Answer

pipelines中的

def close方法定义错误了

应为这样

def close(self, spider)

至于忽略某些内容为空的值
用for 可能节省代码！

def process_item(self, item, spider):
    for k,v in item.items():
        if v == '':
            raise DropItem(repr(item))