<?php header("Content-Type: text/html; charset=UTF-8"); require("phpQuery.php"); $hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text'))); //dump($hj->data); $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array( 'image' => array('img','src') ))->data; // $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array( 'link' => array('a','href') ))->data; $page = 'http://cms.querylist.cc/news/566.html'; $reg = array( 'title' => array('h1','text'), 'date' => array('.pt_info','text','-span -a',function($content){ $arr = explode(' ',$content); return $arr[0]; }), 'content' => array('.post_content','html','a -.content_copyright -script',function($content){ $doc = phpQuery::newDocumentHTML($content); $imgs = pq($doc)->find('img'); foreach ($imgs as $img) { $src = 'http://cms.querylist.cc'.pq($img)->attr('src'); $localSrc = 'w/'.md5($src).'.jpg'; $stream = file_get_contents($src); file_put_contents($localSrc,$stream); pq($img)->attr('src',$localSrc); } return $doc->htmlOuter(); }) ); $rang = '.content'; $ql = QueryList::Query($page,$reg,$rang); $data = $ql->getData(); dump($data);
prend en charge l'exploration de sites Web et l'exploration. Il est très puissant. Il s'agit d'un projet open source côté serveur basé sur PHP. Il permet aux développeurs PHP de traiter facilement le contenu d'un document DOM, par exemple pour obtenir les informations principales d'un site Web d'actualités. Ce qui est plus intéressant, c'est qu'il utilise l'idée dejQuery. Vous pouvez traiter le contenu de la page comme si vous utilisiez jQuery pour obtenir les informations de page souhaitées.
Toutes les ressources de ce site proviennent d'internautes ou sont réimprimées par les principaux sites de téléchargement. Veuillez vérifier vous-même l'intégrité du logiciel ! Toutes les ressources de ce site sont uniquement à titre de référence d'apprentissage. Merci de ne pas les utiliser à des fins commerciales. Sinon, vous serez responsable de toutes les conséquences ! En cas d'infraction, veuillez nous contacter pour la supprimer. Coordonnées : admin@php.cn
Article connexe
13 Jun 2023
Un programme de robot d'exploration Web fait référence à un programme qui obtient et analyse automatiquement des informations sur Internet. C'est également l'un des outils importants pour la collecte de données et le traitement de l'information. À l’ère d’Internet, les données constituent un atout extrêmement précieux, et pouvoir obtenir rapidement et précisément des informations sur des sites Web cibles est très important tant pour les entreprises que pour les particuliers. L’utilisation de robots d’exploration Web peut atteindre cet objectif plus efficacement. En tant que langage de programmation efficace, les excellentes fonctionnalités de programmation réseau de PHP et ses riches bibliothèques open source en font un langage très approprié pour développer des programmes de robots d'exploration Web. Livre
17 Dec 2021
Cet article vous présentera comment implémenter facilement la fonction d'exploration de sites Web dans Node à l'aide de bibliothèques open source tierces. J'espère que cela vous sera utile !
27 Jul 2017
Les détails sont les suivants : import requestimport reurl = 'http://www.cnblogs.com/xxxx'def get_html(url): #Ouvrez l'url et obtenez toutes les informations html de l'url html_content = requ
21 Mar 2024
À l’ère d’Internet d’aujourd’hui, la création de sites Web est devenue l’une des compétences indispensables pour de nombreuses personnes. En tant que langage de programmation back-end largement utilisé, PHP est connu et utilisé par de nombreux développeurs. Cependant, il existe de nombreuses autres options pour créer un site Web en plus de PHP. Cet article vous donnera un aperçu approfondi des options de création de votre site Web autres que PHP et vous fournira des exemples de code concrets. PythonPython est un langage de programmation puissant et facile à apprendre, largement utilisé dans le développement Web. Utiliser Python
02 May 2024
Introduction aux mesures de sécurité des sites Web PHP Il est crucial de protéger votre site Web contre les cybermenaces. Pour les sites Web PHP, prendre des mesures de sécurité appropriées est essentiel pour garantir la confiance des données et des utilisateurs. Cet article abordera une série de mesures de protection de sécurité PHP efficaces et pratiques et fournira des illustrations de cas pratiques. 1. Objectif de vérification des entrées : empêcher les entrées malveillantes de provoquer l’exécution de code ou des attaques par injection SQL. Méthode : utilisez des fonctions PHP intégrées (telles que filter_input()) ou des bibliothèques tierces (telles que htmlpurifier) pour vérifier les entrées de l'utilisateur et filtrer les caractères malveillants et les codes HTML. Cas pratique :
07 May 2020
Les raisons pour lesquelles le développement de sites Web PHP est efficace : 1. PHP est un langage faiblement typé, qui est plus efficace que d'autres langages fortement typés ; 2. PHP est livré avec de puissantes bibliothèques de fonctions, telles que json_encode, diverses opérations sur les tableaux et divers tris ; . Le tableau array en php améliore considérablement l'efficacité du développement.
Outils chauds Tags
Hot Tools
Bibliothèque PHP pour les conteneurs d'injection de dépendances
Bibliothèque PHP pour les conteneurs d'injection de dépendances
Une collection de 50 excellents algorithmes PHP classiques
Algorithme PHP classique, apprenez d'excellentes idées et élargissez votre réflexion
Petite bibliothèque PHP pour optimiser les images
Petite bibliothèque PHP pour optimiser les images