masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > 实例解析Python如何实现爬取京东手机图片

实例解析Python如何实现爬取京东手机图片

零到壹度

Lepaskan： 2018-03-30 10:30:18

asal

2081 orang telah melayarinya

本文主要为大家分享一篇Python如何实现爬取京东手机图片的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧，希望能帮助到大家。

运行环境Python3.6.4

<span style="font-size: 14px; font-family: 微软雅黑, "Microsoft YaHei";">#爬取京东手机图片import re #导入re模块import urllib.request  #导入urllib.request模块def craw(url,page): #定义函数craw<br/>    html1 = urllib.request.urlopen(url).read() #调用urllib.request模块里的urlopen函数打开url链接，并且读取，最后赋值给html1<br/>    html1 = str(html1) #将html1网页内容变成字符串<br/>    pat1 = &#39;&#39;&#39;<p id="plist".+? <p class="page clearfix">&#39;&#39;&#39; #利用pat1正则表达式进行第一次信息过滤<br/>    result1 = re.compile(pat1).findall(html1)  #查找所有符合条件的信息<br/>    result1 = result1[0]<br/>    pat2 = &#39;&#39;&#39;<img width="220" height="220" data-img="1".+?"//(.+?\.jpg)">&#39;&#39;&#39;#".+?"组合可以匹配除换行外的任意字符，第二个正则表达式进行第二次过滤<br/>    imagelist = re.compile(pat2).findall(result1)<br/>    x = 1<br/>    for imageurl in imagelist:<br/>        imagename = "D:/Python35/myweb/part6/img1/"+"第"+str(page)+"页图"+str(x)+".jpg"<br/>        imageurl = "http://"+imageurl        try:<br/>            urllib.request.urlretrieve(imageurl,filename=imagename)        except urllib.error.URLError as e:            if hasattr(e,"code"):<br/>                x+=1<br/>            if hasattr(e,"reason"):<br/>                x+=1<br/>        x+=1for i in range(1,2):<br/>    url = "http://list.jd.com/list.html?cat=9987,653,655&page="+str(i)<br/>    craw(url,i)</span>

Salin selepas log masuk

相关推荐：

python爬虫实践---爬取京东图片

京东手机图片爬取

实例爬取京东收集图片

Atas ialah kandungan terperinci 实例解析Python如何实现爬取京东手机图片. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

python Jingdong

sumber：php.cn

Artikel sebelumnya：如何使用scrapy框架循环爬京东数据后导入Mysql的方法 Artikel seterusnya：Python之爬取其他网页

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

跟我学PS第八天02：光效素材的抠图方法

2018-08-28 15:02:42
跟我学PS第八天01：如何抠取文件中的印章

2018-08-25 10:55:46
跟我学PS第七天02：如何抠出复杂树林

2018-08-20 16:25:41
跟我学PS第七天01：如何将彩图抠出线稿效果

2018-08-18 11:26:54
跟我学PS第六天02：模糊工具

2018-08-14 16:35:58
跟我学PS第六天01：修复画笔工具

2018-07-28 15:36:43
跟我学PS第五天02：移动工具的使用方法和应用

2018-07-27 16:59:00
跟我学PS第五天01：使用裁剪工具

2018-07-27 15:22:47
跟我学PS第四天02：练习Photoshop中的套索工具

2018-07-23 17:56:00
跟我学PS第四天01：如何给照片加边框效果

2018-07-23 16:21:38

Isu terkini

Python/MySQL tidak dapat mengekalkan data integer dengan betul Tiada kod diperlukan di sini. Saya mahu menyimpan nombor yang sangat panjang kerana saya s...

daripada 2024-04-04 19:09:44

0

1

367

Menggunakan selenium ingin mengklik dan menentukan URL dalam kelas Saya perlukan petua lain hari ini. Saya cuba membina kod Python/Selenium dan ideanya ialah...

daripada 2024-04-04 14:14:44

0

1

3492

Selenium + Python - periksa imej melalui execute_script Saya perlu mengesahkan bahawa imej dipaparkan pada halaman menggunakan selenium dalam pyth...

daripada 2024-04-03 09:32:15

0

1

375

Bagaimana untuk mengekalkan baris X pertama dan memadamkan baris jadual Saya mempunyai jadual besar dengan berjuta-juta rekod dalam MySQLincident_archive, saya ma...

daripada 2024-04-01 18:32:54

0

1

347

Bagaimana untuk mengikis teks Cuaca Google tertentu menggunakan BeautifulSoup? Bagaimana untuk mencari teks kursus "New York City, USA" dalam Python menggunaka...

daripada 2024-04-01 14:06:14

0

1

308

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan