masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > python爬虫难学吗

python爬虫难学吗

silencement

Lepaskan： 2019-06-12 15:18:56

asal

4002 orang telah melayarinya

简单来说互联网是由一个个站点和网络设备组成的大网，我们通过浏览器访问站点，站点把HTML、JS、CSS代码返回给浏览器，这些代码经过浏览器解析、渲染，将丰富多彩的网页呈现我们眼前。

python爬虫难学吗

爬虫是什么？

如果我们把互联网比作一张大的蜘蛛网，数据便是存放于蜘蛛网的各个节点，而爬虫就是一只小蜘蛛，沿着网络抓取自己的猎物（数据）爬虫指的是：向网站发起请求，获取资源后分析并提取有用数据的程序；从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二进制数据（图片、视频）爬到本地，进而提取自己需要的数据，存放起来使用。

爬虫的基本流程

用户获取网络数据的方式：

方式1：浏览器提交请求--->下载网页代码--->解析成页面

方式2：模拟浏览器发送请求(获取网页代码)->提取有用的数据->存放于数据库或文件中

爬虫要做的就是方式2；

发起请求

使用http库向目标站点发起请求，即发送一个Request

Request包含：请求头、请求体等

Request模块缺陷：不能执行JS 和CSS 代码

获取响应内容

如果服务器能正常响应，则会得到一个Response

Response包含：html，json，图片，视频等

解析内容

解析html数据：正则表达式（RE模块），第三方解析库如Beautifulsoup，pyquery等

解析json数据：json模块

解析二进制数据:以wb的方式写入文件

保存数据

数据库（MySQL，Mongdb、Redis）

文件

Atas ialah kandungan terperinci python爬虫难学吗. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

reptilia

sumber：php.cn

Artikel sebelumnya：python能开发单片机吗 Artikel seterusnya：python会取代java吗

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

如何设置cookie和删除cookie

2020-02-27 16:50:07
ThinkPHP5中的事务操作

2020-01-30 22:49:41
ThinkPHP5.1中使用redis缓存

2020-01-30 22:43:08
php中常用的正则表达式使用方法

2023-04-08 11:32:02
PHP中Trait的用法及示例

2023-04-08 11:24:01
PHP中的global关键字用法

2023-04-08 11:00:01
PHP中字符串处理的一些常用函数

2023-04-08 10:56:02
mysql正则匹配模糊查询某个字段

2023-04-08 10:54:02
PHP7.4新特性汇总

2023-04-08 10:36:01
TP6验证码验证失败的原因以及解决办法

2023-04-08 10:34:01

Isu terkini

Mengapakah bilangan kuki dalam pengepala permintaan "Kuki" melebihi bilangan kuki yang ditetapkan dalam pengepala respons "set-kuki"? Saya seorang pemula dalam merangkak web, jadi pemahaman saya tentang permintaan http sanga...

daripada 2024-04-05 14:52:06

0

1

3571

Bagaimana untuk menyimpan pemberitahuan untuk berbilang pengguna dalam pangkalan data phpmysql tanpa membebankan pangkalan data dengan rekod Saya bimbang saya boleh membuat rangkak dalam pangkalan data dengan mudah sambil cuba mema...

daripada 2024-03-30 22:51:20

0

1

411

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan