communauté Apprendre Bibliothèque d'outils Loisirs

Français

Maison > développement back-end > Tutoriel Python > python使用scrapy解析js示例

python使用scrapy解析js示例

WBOY

Libérer： 2016-06-16 08:45:26

original

1147 Les gens l'ont consulté

复制代码代码如下:

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['http://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

# Extract links matching 'item.php' and parse them with the spider's method parse_item
)

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "http://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

time.sleep(2.5)

Étiquettes associées：

解析js

source：php.cn

Article précédent：paramiko模块安装和使用(远程登录服务器) Article suivant：python实现批量转换文件编码(批转换编码示例)

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Qu'est-ce qu'une NullPointerException et comment y remédier ?

2024-10-22 09:46:29
De novice à codeur : votre voyage commence par les principes fondamentaux du C

2024-10-13 13:53:41
Débloquer le développement Web avec PHP : guide du débutant

2024-10-12 12:15:51
Démystifier C : un chemin clair et simple pour les nouveaux programmeurs

2024-10-11 22:47:31
Libérez votre potentiel de codage : programmation C pour les débutants absolus

2024-10-11 19:36:51
Libérez votre programmeur intérieur : C pour les débutants absolus

2024-10-11 15:50:41
Automatisez votre vie avec C : scripts et outils pour les débutants

2024-10-11 15:07:41
PHP Made Easy : vos premiers pas dans le développement Web

2024-10-11 14:21:21
Construisez n'importe quoi avec Python : un guide du débutant pour libérer votre créativité

2024-10-11 12:59:11
La clé du codage : libérer la puissance de Python pour les débutants

2024-10-11 12:17:31

Derniers numéros

PHP : expression régulière pour faire correspondre et remplacer plusieurs instances de plusieurs correspondances en double Je cherche à écrire un système de shortcode pour une communauté/base de données de jeux où...

Depuis 2024-04-04 15:41:01

0

1

439

Le chemin de routage ne restitue pas les composants React.js J'essaie de créer des itinéraires de chemin animés à l'aide de framer-motion, mais le comp...

Depuis 2024-04-04 10:37:17

0

1

429

SimpleXML ne charge pas les données GML J'ai les exemples de données XML suivants que je souhaite analyser en SimpleXML à l'aide d...

Depuis 2024-04-04 10:04:41

0

1

358

Générer du contenu à l'aide d'Ajax - le défilement jusqu'à Id ne fonctionne pas Je génère du contenu de page basé sur des données obtenues via ajax. Le problème que j'ai ...

Depuis 2024-04-04 09:29:39

0

1

397

La question est toujours la même, mais le titre est réécrit comme suit : Ma fonction aléatoire Javascript ne parvient pas à générer des réponses valides Je crée un simple jeu générateur de nombres aléatoires en utilisant JS et HTML. Dans ce je...

Depuis 2024-04-03 22:03:14

0

1

275

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal