社群學習工具庫休閒

繁体中文

首頁 > 後端開發 > Python教學 > python使用scrapy解析js示例

python使用scrapy解析js示例

WBOY

發布： 2016-06-16 08:45:26

原創

1147 人瀏覽過

复制代码代码如下:

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['http://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

# Extract links matching 'item.php' and parse them with the spider's method parse_item
)

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "http://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

time.sleep(2.5)

相關標籤：

解析js

來源：php.cn

上一篇：paramiko模块安装和使用(远程登录服务器) 下一篇：python实现批量转换文件编码(批转换编码示例)

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

PHP：正規表示式匹配和替換多個重複匹配的多個實例我正在尋找為遊戲社群/資料庫編寫一個短代碼系統，用戶可以在其中添加諸如((MagicalSword))之類的內容到他們的內容中，它將被解析為指向相關項目的漂亮連結帶有內嵌縮圖。這是...

來自於 2024-04-04 15:41:01

0

1

439

路由路徑不渲染react.js元件我正在嘗試使用framer-motion製作一些動畫路徑路由，但元件沒有出現，並且顯然有一個錯誤說無法在routesWithAnimation.js中解析路由Home、Contac...

來自於 2024-04-04 10:37:17

0

1

429

SimpleXML 未載入 GML 數據我有以下範例XML數據，我想使用PHP將其解析為SimpleXML：<?xmlversion="1.0"encoding="utf-8"...

來自於 2024-04-04 10:04:41

0

1

358

使用 Ajax 產生內容 - 捲動到 Id 不起作用我根據透過ajax取得的數據產生頁面內容。我遇到的問題是，當我想滾動到某個ID時，滾動要么不會發生，要么滾動到錯誤的位置。我一直在查看SO問答，但沒有找到任何好的解決方案。很多答案...

來自於 2024-04-04 09:29:39

0

1

397

問題仍然是原來的，但標題重寫如下：My Javascript random function fails to generate valid responses 我正在使用JS和HTML製作一個簡單的隨機數產生器遊戲。在這個遊戲中，您可以設定隨機數的最小值和最大值。但是，當設定變數並記錄結果時，出現了不可能的數字。例如，如果我將最小值設為5...

來自於 2024-04-03 22:03:14

0

1

275

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422666
php入門教程之一週學會PHP

4267541
JAVA 初級入門影片教學

2530222
小甲魚零基礎入門學習Python影片教學

506998
PHP 零基礎入門教學

862164

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板