python - Scrapy 爬虫的时候只能抓取到页面的一条数据，请教不知道是不是网站做了反爬虫的手段？-PHP中国語ネットワークQ&A

記事特集学ぶダウンロードに質問プログラミング辞典ゲーム最近の更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

python - Scrapy 爬虫的时候只能抓取到页面的一条数据，请教不知道是不是网站做了反爬虫的手段？

怪我咯 2017-04-17 16:38:11

0

1

806

我爬虫的目标网址是http://jobs.monster.com/search/software_5
想要保存这个网站上每一条工作的标题、链接、公司和发布时间

我自己检查的时候用sites = hxs.select('//p')获取所有的p
结果发现本来只能得到一条工作的信息

例如：每个工作里都该有个p class=jobTitle，但是在数据里只能找到一个这样的p

这个网站刚刚改版，之前都还能顺利获取数据，请有经验的大神指点我一个解决方案。

怪我咯

走同样的路，发现不同的人生

全員に返信(1)

PHPzhong2017-04-17 16:40:11 1棟

解決済み

データはすべて js 内にあり、js 内のデータは、response.body と正規表現を通じて直接取得されます。この方法はあまり良くありませんが、同じ問題を抱えている学生は Python-webkit を学ぶことができます。

いいねを押す +0

返信を追加

人気のトピック

詳細>

人気の記事

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

私たちについて免責事項 Sitemap: PHP中国語ウェブサイト：福祉オンライン PHP トレーニング，PHP 学習者の迅速な成長を支援します！