84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?
光阴似箭催人老,日月如移越少年。
phantomJS可以。
除非是非常复杂的前端逻辑(比如说有一大堆逻辑去算token了) 否则不建议去模拟执行js他如果是动态加载的数据 直接拿json不是更简单
有解析js脚本的jar包,具体包记不清了。
就爬虫而言,直接模拟浏览器解析Javascript是不可取的。你可以直接抓取生成对应网页的json之类的来实现。
如果用java可以试一下Selinium的WebDriver,如果用js写那就直接phantomjs
参考下这个文档如何爬取JS动态生成的数据?http://doc.shenjianshou.cn/de...
phantomJS可以。
除非是非常复杂的前端逻辑(比如说有一大堆逻辑去算token了) 否则不建议去模拟执行js
他如果是动态加载的数据 直接拿json不是更简单
有解析js脚本的jar包,具体包记不清了。
就爬虫而言,直接模拟浏览器解析Javascript是不可取的。你可以直接抓取生成对应网页的json之类的来实现。
如果用java可以试一下Selinium的WebDriver,如果用js写那就直接phantomjs
参考下这个文档
如何爬取JS动态生成的数据?http://doc.shenjianshou.cn/de...