지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > python使用scrapy解析js示例

python使用scrapy解析js示例

WBOY

풀어 주다： 2016-06-16 08:45:26

원래의

1151명이 탐색했습니다.

复制代码代码如下:

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['http://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

# Extract links matching 'item.php' and parse them with the spider's method parse_item
)

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "http://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

time.sleep(2.5)

관련 라벨：

解析js

원천：php.cn

이전 기사：paramiko模块安装和使用(远程登录服务器) 다음 기사：python实现批量转换文件编码(批转换编码示例)

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

NullPointerException은 무엇이며 어떻게 해결합니까?

2024-10-22 09:46:29
초보자에서 코더까지: C 기초로 시작되는 여정

2024-10-13 13:53:41
PHP로 웹 개발 잠금 해제: 초보자 가이드

2024-10-12 12:15:51
C에 대한 이해: 새로운 프로그래머를 위한 명확하고 간단한 길

2024-10-11 22:47:31
코딩 잠재력 발휘: 완전 초보자를 위한 C 프로그래밍

2024-10-11 19:36:51
내면의 프로그래머를 깨워보세요: 완전 초보자를 위한 C

2024-10-11 15:50:41
C로 일상을 자동화하세요: 초보자를 위한 스크립트 및 도구

2024-10-11 15:07:41
PHP가 쉬워졌습니다: 웹 개발의 첫 번째 단계

2024-10-11 14:21:21
Python으로 무엇이든 빌드하기: 창의력을 발휘하기 위한 초보자 가이드

2024-10-11 12:59:11
코딩의 핵심: 초보자를 위한 Python의 힘 활용

2024-10-11 12:17:31

최신 이슈

PHP: 여러 중복 일치 항목의 여러 인스턴스를 일치시키고 바꾸는 정규식 저는 사용자가 콘텐츠에 ((MagicalSword))와 같은 것을 추가할 수 있고 인라인 썸네일을 사용하여 관련 항목에 대한 멋진 링크로 구문 분석되는 게임 커뮤...

에서 2024-04-04 15:41:01

0

1

439

라우팅 경로가 React.js 구성 요소를 렌더링하지 않습니다. 프레이머 모션을 사용하여 일부 애니메이션 경로 경로를 만들려고 하는데 구성요소가 표시되지 않고 RouteWithAnimation.js에서 Home, Contact...

에서 2024-04-04 10:37:17

0

1

429

SimpleXML이 GML 데이터를 로드하지 않음 PHP를 사용하여 SimpleXML로 구문 분석하려는 다음과 같은 샘플 XML 데이터가 있습니다. <?xmlversion="1.0"enco...

에서 2024-04-04 10:04:41

0

1

358

Ajax를 사용하여 콘텐츠 생성 - ID로 스크롤하면 작동하지 않습니다. Ajax를 통해 얻은 데이터를 기반으로 페이지 콘텐츠를 생성합니다. 내가 겪고 있는 문제는 특정 ID로 스크롤하려고 할 때 스크롤이 발생하지 않거나 잘못된 위치로...

에서 2024-04-04 09:29:39

0

1

397

질문은 여전히 원본이지만 제목은 다음과 같이 다시 작성되었습니다. 내 Javascript 무작위 함수가 유효한 응답을 생성하지 못했습니다. 저는 JS와 HTML을 사용하여 간단한 난수 생성기 게임을 만들고 있습니다. 이 게임에서는 난수의 최소값과 최대값을 설정할 수 있습니다. 그런데 변수를 설정하고 ...

에서 2024-04-03 22:03:14

0

1

275

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿