84669 人が学習中
152542 人が学習中
20005 人が学習中
5487 人が学習中
7821 人が学習中
359900 人が学習中
3350 人が学習中
180660 人が学習中
48569 人が学習中
18603 人が学習中
40936 人が学習中
1549 人が学習中
1183 人が学習中
32909 人が学習中
我爬虫的目标网址是http://jobs.monster.com/search/software_5想要保存这个网站上每一条工作的标题、链接、公司和发布时间
我自己检查的时候用sites = hxs.select('//p')获取所有的p结果发现本来只能得到一条工作的信息
例如:每个工作里都该有个p class=jobTitle,但是在数据里只能找到一个这样的p
这个网站刚刚改版,之前都还能顺利获取数据,请有经验的大神指点我一个解决方案。
走同样的路,发现不同的人生
解決済み
データはすべて js 内にあり、js 内のデータは、response.body と正規表現を通じて直接取得されます。この方法はあまり良くありませんが、同じ問題を抱えている学生は Python-webkit を学ぶことができます。
解決済み
データはすべて js 内にあり、js 内のデータは、response.body と正規表現を通じて直接取得されます。この方法はあまり良くありませんが、同じ問題を抱えている学生は Python-webkit を学ぶことができます。