python - scrapy를 사용하여 웹사이트 콘텐츠를 크롤링할 때 일부 콘텐츠의 빈 값을 무시하는 방법
大家讲道理
大家讲道理 2017-06-14 10:53:17
0
1
1052

JD.com에서 모든 휴대폰 정보를 크롤링할 때 다음과 같은 문제가 발생했습니다.
1 다음 그림과 같이 반환 값이 너무 많습니다.

2. 스파이더 코드는 다음과 같습니다.

-- 코딩: utf-8 --

scrapy 가져오기
from scrapy.http 가져오기 요청
from ueinfo.items 가져오기 UeinfoItem

class MrueSpider(scrapy.Spider):

으아악

파이프라인의 코드는 다음과 같습니다:

-- 코딩: utf-8 --

pymysql 가져오기

클래스 UeinfoPipeline(객체):

으아악
大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

모든 응답(1)
漂亮男人

파이프라인에서

def 닫기 방법이 잘못 정의되었습니다

이렇게 해야지

def close(셀프, 스파이더)

빈 내용으로 일부 값을 무시하는 경우
를 사용하면 코드를 절약할 수 있습니다!

으아악
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿