网页爬虫 - java爬虫如何解析JavaScript
大家讲道理
大家讲道理 2017-04-17 17:29:23
0
6
403

用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全員に返信(6)
Peter_Zhu

phantomJS では可能です。

いいねを押す +0
迷茫

非常に複雑なフロントエンド ロジック (たとえば、トークンを計算するためのロジックがたくさんある) でない限り、js の実行をシミュレートすることはお勧めできません
動的に読み込まれるデータの場合、js の実行をシミュレートすることは推奨されませんjson を直接取得する方が簡単です

いいねを押す +0
刘奇

js スクリプトを解析するための jar パッケージがありますが、具体的なパッケージを思い出せません。

いいねを押す +0
大家讲道理

クローラに関する限り、ブラウザの Javascript 解析を直接シミュレートすることはお勧めできません。これを実現するには、対応する Web ページの JSON を直接キャプチャして生成できます。

いいねを押す +0
迷茫

Java を使用する場合は、Selium の WebDriver を試してください。JS を使用する場合は、phantomjs を使用してください。

いいねを押す +0
大家讲道理

このドキュメントを参照してください
JS によって動的に生成されたデータをクロールするにはどうすればよいですか? http://doc.shenjianshou.cn/de...

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート