java - 用Jsoup抓取36氪网站的数据返回null
PHP中文网
PHP中文网 2017-04-18 10:23:55
0
2
624

一、问题描述
用Jsoup抓取36氪网站的这部分数据(下图),也就是<p id="app">里面的数据,总是返回null。

二、我的尝试
1、用id查找

2、用其中的一个类查找

3、打印整个document,结果如下图,好像这是一个空标签。

三、我的思考
当我点击<p id="app">这行代码时(谷歌的“检查”),发现右边的小窗口styles里面有句p{display:block;}。然后我在网站上找到类似的(下图:class="top_swing"),发现获取到的element也是空的。经过查阅,display:block代表元素以块状显示。所以我猜想是不是块状元素要用另外的方法获取,还是其它原因??用Jsoup怎么解决??

PHP中文网
PHP中文网

认证高级PHP讲师

répondre à tous(2)
刘奇

Ces contenus sont générés dynamiquement par Javascript. Ne regardez pas les outils de développement Google, mais faites un clic droit sur la page Web et affichez le code source.
visible

<p id="app"></p>

Si vous utilisez Jsoup ou similaire, vous ne pouvez explorer que le contenu html, mais le contenu généré par js ne peut pas être exploré.

PHPzhong

js générés dynamiquement, probablement Angular.js

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal