> 백엔드 개발 > 파이썬 튜토리얼 > 요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼

요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼

PHP中文网
풀어 주다: 2017-06-20 14:46:43
원래의
2155명이 탐색했습니다.

# 페이지를 요청하는 모듈을 요청합니다
# lxml 모듈의 html 빌드 선택기 선택기(형식화된 응답 응답)
# from lxml import html
# 가져오기 요청

# 응답 = 요청.get(url) .content

# selector = html.formatstring(response)

# hrefs = selector.xpath('/html/body//div[@class='feed-item _j_feed_item']/a + 이것은 페이지를 크롤링하기 전에 html 구조를 주의 깊게 분석해야 합니다. 일부 페이지는 js에 의해 생성됩니다. 이 페이지는 상대적으로 간단하며 향후 에세이에서 관련 정보를 공유하겠습니다.

위 내용은 요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿