masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > tutorial php > php有什么爬虫框架？

php有什么爬虫框架？

PHPz

Lepaskan： 2020-09-04 16:42:06

asal

5999 orang telah melayarinya

php爬虫框架有：1、phpspider，一个爬虫开发框架；2、Beanbun，用PHP编写的多进程网络爬虫框架；3、PHPCrawl，一个PHP开源的Web检索蜘蛛类库。

php有什么爬虫框架？

PHP主流爬虫框架

phpspider

地址:https://github.com/owner888/phpspider

phpspider是一个爬虫开发框架。使用本框架，你不用了解爬虫的底层技术实现，爬虫被网站屏蔽、有些网站需要登录或验证码识别才能爬取等问题。简单几行PHP代码，就可以创建自己的爬虫，利用框架封装的多进程Worker类库，代码更简洁，执行效率更高速度更快。

Beanbun

地址:http://www.beanbun.org/#/

Beanbun 是用 PHP 编写的多进程网络爬虫框架，具有良好的开放性、高可扩展性。

支持守护进程与普通两种模式（守护进程模式只支持 Linux 服务器）

默认使用 Guzzle 进行爬取

支持分布式

支持内存、Redis 等多种队列方式

支持自定义URI过滤

支持广度优先和深度优先两种爬取方式

遵循 PSR-4 标准

爬取网页分为多步，每步均支持自定义动作（如添加代理、修改 user-agent 等）

灵活的扩展机制，可方便的为框架制作插件：自定义队列、自定义爬取方式…

PHPCrawl

地址:http://phpcrawl.cuab.de/

PHPCrawl是一个PHP开源的Web检索蜘蛛(爬虫)类库。PHPCrawl抓取工具“ Spider ”的网站，并提供一切有关网页，链接，文件等信息。

PHPCrawl povides可以选择性的指定的爬虫的行为，比如喜欢网址、内容类型，过滤器、 cookie的处理等方式。

更多相关知识，请访问 PHP中文网！！

Label berkaitan：

php reptilia

sumber：php.cn

Artikel sebelumnya：微信公众平台感觉老是丢报文 Artikel seterusnya：【phpcms-v9】缓存索引caches下的各个文件的作用

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Kunci Pengekodan: Membuka Kunci Kuasa C untuk Pemula

2024-10-13 11:44:01
Sambungkan Laman Web Anda ke Pangkalan Data dengan PHP dan MySQL

2024-10-13 09:56:31
Penyelesaian Masalah dengan Python: Buka Kunci Penyelesaian Berkuasa sebagai Pengekod Pemula

2024-10-11 20:58:41
Kuasa Python, Dipermudahkan: Pendekatan Mesra Pemula untuk Pengaturcaraan

2024-10-11 16:53:11
PHP dan Media Sosial: Sepadukan Laman Web Anda dengan Dunia

2024-10-11 11:54:51
Galeri Imej Dinamik dengan PHP: Pamerkan Kerja Anda Dalam Talian

2024-10-10 16:21:01
Bina API dan Perkhidmatan Web dengan PHP

2024-10-10 15:18:02
Menyahmistikan Java: Laluan Yang Jelas dan Mudah untuk Pengaturcara Baharu

2024-10-10 13:34:01
Cipta Permainan dan Grafik dengan C: Pengenalan yang Seronok dan Praktikal

2024-10-10 13:26:26
Bagaimana cara bermain Cheng Yaojin dalam Glory of Kings?

2024-10-10 11:38:42

Isu terkini

Tatasusunan PHP yang diperoleh daripada parameter URL tidak berkelakuan seperti yang diharapkan Saya mempunyai parameter URL yang mengandungi id kategori dan saya mahu menganggapnya seba...

daripada 2024-04-06 22:09:02

0

1

1428

Di mana saya harus meletakkan arahan CustomLog dalam apache Saya menggunakan php:7.2-apachedocker. Saya perlu melumpuhkan log akses log masuk url sema...

daripada 2024-04-06 22:03:59

0

1

990

Apakah format pembolehubah dalam nilai pulangan? Saya seorang pelajar baru php. Saya menjumpai sekeping kod: if($x<time()){return[false,...

daripada 2024-04-06 21:55:20

0

1

778

Masalah yang dihadapi apabila menggunakan opentbs untuk menjana fail odt: nilai kunci yang sama dipaparkan dalam baris yang sama dan bukannya lajur yang berasingan. Saya menggunakan perpustakaan yang dipanggil OpenTbs untuk mencipta odt menggunakan PHP, s...

daripada 2024-04-06 20:18:18

0

1

483

Kumpulkan hasil MySQL mengikut ID untuk menggelung Saya mempunyai jadual dengan data penerbangan dalam mysql. Saya sedang menulis kod php yan...

daripada 2024-04-06 17:27:56

0

1

406

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan