84669 person learning
152542 person learning
20005 person learning
5487 person learning
7821 person learning
359900 person learning
3350 person learning
180660 person learning
48569 person learning
18603 person learning
40936 person learning
1549 person learning
1183 person learning
32909 person learning
现在想爬取某个关键字下的所有商品的图片,例如关键字:电饭煲,大概要爬4400张图片。我试了一整天的pyspider,但是爬不了,请问用python还有其它方法可以做到吗?
闭关修行中......
Python+PhantomJS+selenium 可以解决你的烦恼参考这篇文章:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3
测试代码:
#coding=utf-8 from selenium import webdriver driver = webdriver.PhantomJS() driver.get("https://s.taobao.com/search?q=iphone") datas = driver.find_elements_by_class_name('J_ItemPic') for _ in datas: print _.get_attribute('src')
參考這個回答:
python爬虫案例
或是這個教學視頻:
如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?
P.S. 建議發問前可以多爬爬文,可能答案早就在裡面囉!
用beautifulsoup很方便选取啊。
题主看下错误提示,抓取不成功总有原因的,看是IP被封还是抓取逻辑有问题Python在线编译执行
这里有个百度图片爬虫:http://blog.csdn.net/qq_34844199/article/details/51468841,可以借鉴
Python+PhantomJS+selenium 可以解决你的烦恼
参考这篇文章:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3
测试代码:
參考這個回答:
python爬虫案例
或是這個教學視頻:
如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?
P.S. 建議發問前可以多爬爬文,可能答案早就在裡面囉!
用beautifulsoup很方便选取啊。
题主看下错误提示,抓取不成功总有原因的,看是IP被封还是抓取逻辑有问题
Python在线编译执行
这里有个百度图片爬虫:http://blog.csdn.net/qq_34844199/article/details/51468841,可以借鉴