communauté Apprendre Bibliothèque d'outils Loisirs

Français

Maison > interface Web > tutoriel HTML > Python爬虫如何处理html中的延迟加载部分（delayload_url）_html/css_WEB-ITnose

Python爬虫如何处理html中的延迟加载部分（delayload_url）_html/css_WEB-ITnose

WBOY

Libérer： 2016-06-24 11:47:22

original

2487 Les gens l'ont consulté

下载链接“http://s.1688.com/selloffer/industry_offer_search.htm?mixWholesale=true&industryFlag=food&categoryId=1032913&from=industrySearch&n=y&filt=y#_fb_top”的源码，结果只包含了页面的一部分内容；该页面共60个商品，但源码中只能解析出20个，且无法找到翻页链接；

应该是以上一段源码实现的延迟加载，在该页面滑轮下拉到底时，才载入新的部分；求教如何解析该页面，获取完整的页面源码，解析全部60个商品和翻页链接。

回复讨论(解决方案)

审核元素找到数据源链接直接用那个链接获取数据

额。。。不知道现在回答还来不来得及！这个可以通过火狐捕捉到延迟加载的url地址，然后就可以找到规律了。我刚好也在爬1688的数据也遇到了延迟加载这个问题，然后通过火狐浏览器捕捉url，发现其实只要把sw-delayload-url这个div里面的url取出来然后在最后面加上&callback=任意字符串，然后每次改变&startIndex=这个就可以了（依次为startIndex=20，startIndex=40），这样就会返回一个json的数据
我试过你贴出来的那个url不知道为什么没数据返回，可能是商品下架了。。。你可以按我说的试试
，如果你已经解决了并有更好的方法的话希望能交流一下，谢谢

Étiquettes associées：

Python爬虫如何处理html中的延迟加载部分（delayload_url）

source：php.cn

Article précédent：html表格_html/css_WEB-ITnose Article suivant：Ext子页面操作父页面_html/css_WEB-ITnose

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Qu'est-ce qu'une NullPointerException et comment y remédier ?

2024-10-22 09:46:29
De novice à codeur : votre voyage commence par les principes fondamentaux du C

2024-10-13 13:53:41
Débloquer le développement Web avec PHP : guide du débutant

2024-10-12 12:15:51
Démystifier C : un chemin clair et simple pour les nouveaux programmeurs

2024-10-11 22:47:31
Libérez votre potentiel de codage : programmation C pour les débutants absolus

2024-10-11 19:36:51
Libérez votre programmeur intérieur : C pour les débutants absolus

2024-10-11 15:50:41
Automatisez votre vie avec C : scripts et outils pour les débutants

2024-10-11 15:07:41
PHP Made Easy : vos premiers pas dans le développement Web

2024-10-11 14:21:21
Construisez n'importe quoi avec Python : un guide du débutant pour libérer votre créativité

2024-10-11 12:59:11
La clé du codage : libérer la puissance de Python pour les débutants

2024-10-11 12:17:31

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2190

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

2340

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

1963

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

1849

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

1906

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal