现在想爬取某个关键字下的所有商品的图片,例如关键字:电饭煲,大概要爬4400张图片。我试了一整天的pyspider,但是爬不了,请问用python还有其它方法可以做到吗?
闭关修行中......
Python+PhantomJS+selenium 可以解决你的烦恼参考这篇文章:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3
测试代码:
#coding=utf-8 from selenium import webdriver driver = webdriver.PhantomJS() driver.get("https://s.taobao.com/search?q=iphone") datas = driver.find_elements_by_class_name('J_ItemPic') for _ in datas: print _.get_attribute('src')
参考这个回答:
python爬虫案例
或是这个教学视频:
如何使用Python 的requests 及BeautifulSoup4 完成淘宝爬虫?
P.S. 建议发问前可以多爬爬文,可能答案早就在里面啰!
用beautifulsoup很方便选取啊。
题主看下错误提示,抓取不成功总有原因的,看是IP被封还是抓取逻辑有问题Python在线编译执行
这里有个百度图片爬虫:http://blog.csdn.net/qq_34844199/article/details/51468841,可以借鉴
Python+PhantomJS+selenium 可以解决你的烦恼
参考这篇文章:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3
测试代码:
参考这个回答:
python爬虫案例
或是这个教学视频:
如何使用Python 的requests 及BeautifulSoup4 完成淘宝爬虫?
P.S. 建议发问前可以多爬爬文,可能答案早就在里面啰!
用beautifulsoup很方便选取啊。
题主看下错误提示,抓取不成功总有原因的,看是IP被封还是抓取逻辑有问题
Python在线编译执行
这里有个百度图片爬虫:http://blog.csdn.net/qq_34844199/article/details/51468841,可以借鉴