Der Inhalt dieses Artikels befasst sich mit dem Crawlen von Daten in PHP (mit Code). Ich hoffe, dass er für Freunde hilfreich ist.
Offizielle Website: Einfaches, flexibles und leistungsstarkes PHP-Erfassungstool, das die Erfassung erleichtert.
Einführung:
QueryList verwendet den jQuery-Selektor für die Sammlung, sodass Sie sich von komplexen regulären Ausdrücken verabschieden können. QueryList verfügt über dieselben DOM-Betriebsfunktionen, HTTP-Netzwerkbetriebsfunktionen, Funktionen zur Auflösung verstümmelten Codes und Funktionen zur Inhaltsfilterung als jQuery Und Skalierbarkeit; es kann problemlos komplexe Netzwerkanforderungen wie simulierte Anmeldung, gefälschte Browser, HTTP-Proxy usw. implementieren, es verfügt über umfangreiche Plug-Ins, unterstützt Multithread-Sammlung und verwendet PhantomJS, um dynamisch gerenderte JavaScript-Seiten zu sammeln.
Installation
Installation über Composer:
composer require jaeger/querylist
Tutorial:
Direkter Code:
<?php include './vendor/autoload.php'; // 使用composer安装后引入目录 use QL\QueryList; // 使用插件 $html = file_get_contents('https://www.biqudu.com/14_14778/'); // 手动获取页面 $data = QueryList::html($html); // 得到页面内容 $data = QueryList::setHtml('https://www.biqudu.com/14_14778/'); // 等同于上面的html() $data->rules([ // 采集所有a标签的href属性 'link' => ['a','href'], // 采集所有a标签的文本内容 'text' => ['a','text'] ]); // 此处$data = 上面已经获取到网页内容之后的对象 // 设置采集规则 替代了传统正则 $data->query(); // 此处$data = 上面已经获取到网页内容之后的对象 // query 执行操作 $data->getData(); // 此处$data = 上面已经获取到网页内容之后的对象 // 得到数据结果 $data->all(); // 此处$data = 上面已经获取到网页内容之后的对象 // 将数据转换成二维数组 print_r($data->all()); // 打印结果
Die obige grundlegende Verwendungsmethode ist Auf diese Weise Wir können bereits eine bestimmte Datenmenge erfassen
Verwandte Empfehlungen:
PHP-Code zur Implementierung der Crawler-Aufzeichnung ist super effektiv, PHP-Code-Crawler
Das obige ist der detaillierte Inhalt vonSo crawlen Sie Daten in PHP (mit Code). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!