网页爬虫 - java爬虫如何解析JavaScript
大家讲道理
大家讲道理 2017-04-17 17:29:23
0
6
405

用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回覆(6)
Peter_Zhu

phantomJS可以。

迷茫

除非是非常複雜的前端邏輯(比如說有一大堆邏輯去算token了) 否則不建議去模擬執行js
他如果是動態載入的資料 直接拿json不是更簡單

刘奇

有解析js腳本的jar包,具體包記不清了。

大家讲道理

就爬蟲而言,直接模擬瀏覽器解析Javascript是不可取的。你可以直接抓取產生對應網頁的json之類的來實現。

迷茫

如果用java可以試試Selinium的WebDriver,如果用js寫那就直接phantomjs

大家讲道理

參考下這篇文件
如何爬取JS動態產生的資料? http://doc.shenjianshou.cn/de...

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板