Article Sujet apprentissage Télécharger Questions et réponses Dictionnaire de programmation Jeu mises à jour récentes

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Maison> développement back-end> Tutoriel Python> le corps du texte

python爬虫通俗点讲是什么

尚

Libérer： 2019-07-06 11:29:00

original

18296 Les gens l'ont consulté

世界上80%的爬虫是基于Python开发的，学好爬虫技能，可为后续的大数据分析、挖掘、机器学习等提供重要的数据源。

python爬虫通俗点讲是什么

什么是爬虫？
网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
其实通俗的讲就是通过程序去获取web页面上自己想要的数据，也就是自动抓取数据。
爬虫可以做什么？
你可以用爬虫爬图片，爬取视频等等你想要爬取的数据，只要你能通过浏览器访问的数据都可以通过爬虫获取。
爬虫的本质是什么？
模拟浏览器打开网页，获取网页中我们想要的那部分数据
浏览器打开网页的过程：
当你在浏览器中输入地址后，经过DNS服务器找到服务器主机，向服务器发送一个请求，服务器经过解析后发送给用户浏览器结果，包括html,js,css等文件内容，浏览器解析出来最后呈现给用户在浏览器上看到的结果。
所以用户看到的浏览器的结果就是由HTML代码构成的，我们爬虫就是为了获取这些内容，通过分析和过滤html代码，从中获取我们想要资源。

更多Python相关技术文章，请访问Python教程栏目进行学习！

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

python爬虫是什么

source：php.cn

Article précédent：python能做嵌入式吗 Article suivant：python字典怎么添加元素

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

php+redis实现加锁与解锁操作

2020-06-20 16:55:06
增加redis命令的方法

2020-06-20 16:40:40
SpringBoot整合Redis缓存的方法介绍

2020-06-20 16:30:28
layui中动态设置checkbox选中状态的方法介绍

2020-06-20 16:12:34
JavaScript判断"字典"为空的方法

2020-06-20 13:30:41
go语言中自定义包的方法

2020-06-19 17:51:14
go语言中的结构体与方法详解

2020-06-19 17:44:19
10种java数组常用的方法

2020-06-19 17:28:02
python中5种连接字符串的方法

2020-06-19 17:18:44
python中如何创建数值列表

2020-06-19 17:10:59

Derniers numéros

Impossible de charger le dataframe Python dans MySQL J'essaie de charger un dataframe python dans MySQL. Il renvoie l'erreur « Échec du paramèt...

Depuis 2023-09-14 22:10:45

0

1

270

Comment le robot d'exploration PHP accède-t-il à l'agent du robot d'exploration dynamique ? Comment le robot d'exploration php accède-t-il à l'agent du robot d'exploration ? Avez-vou...

Depuis 2020-03-13 17:10:19

0

0

835

MyWeb ne peut pas être exécuté et l'invite suivante apparaît. Pourriez-vous m'aider à découvrir quel est le problème ? MyWeb ne peut pas être exécuté et l'invite suivante apparaît. Pourriez-vous m'aider à déco...

Depuis 2019-12-26 17:08:49

0

0

1010

Il y a un problème lors de la génération de la base de données dans le projet Django en Python ? Quelle est la situation lorsque « Avez-vous installé mysqlclient ou MySQL-python ? » appar...

Depuis 2017-12-08 16:51:52

0

2

1180

Comment importer le fichier simple_HTML_DOM dans ThinkPHP5 Je souhaite créer un robot d'exploration Web pour obtenir des données. J'ai maintenant un ...

Depuis 2017-12-07 13:26:15

0

0

950

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal

À propos de nous Clause de non-responsabilité Sitemap: Site Web PHP chinois：Formation PHP en ligne sur le bien-être public，Aidez les apprenants PHP à grandir rapidement！