<?php header("Content-Type: text/html; charset=UTF-8"); require("phpQuery.php"); $hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text'))); //dump($hj->data); $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array( 'image' => array('img','src') ))->data; // $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array( 'link' => array('a','href') ))->data; $page = 'http://cms.querylist.cc/news/566.html'; $reg = array( 'title' => array('h1','text'), 'date' => array('.pt_info','text','-span -a',function($content){ $arr = explode(' ',$content); return $arr[0]; }), 'content' => array('.post_content','html','a -.content_copyright -script',function($content){ $doc = phpQuery::newDocumentHTML($content); $imgs = pq($doc)->find('img'); foreach ($imgs as $img) { $src = 'http://cms.querylist.cc'.pq($img)->attr('src'); $localSrc = 'w/'.md5($src).'.jpg'; $stream = file_get_contents($src); file_put_contents($localSrc,$stream); pq($img)->attr('src',$localSrc); } return $doc->htmlOuter(); }) ); $rang = '.content'; $ql = QueryList::Query($page,$reg,$rang); $data = $ql->getData(); dump($data);
支援抓取網站,進行爬蟲,非常強大,是一個基於PHP的服務端開源項目,它可以讓PHP開發人員輕鬆處理DOM文檔內容,例如獲取某新聞網站的頭條信息。更有趣的是,它採用了jQuery的思想,你可以像使用jQuery一樣處理頁面內容,獲得你想要的頁面資訊。
本站所有資源皆由網友貢獻或各大下載網站轉載。請自行檢查軟體的完整性!本站所有資源僅供學習參考。請不要將它們用於商業目的。否則,一切後果都由您負責!如有侵權,請聯絡我們刪除。聯絡方式:admin@php.cn
相關文章

18 Dec 2024
從 PHP 中的其他類別存取 MySQLi 連線從 PHP 5.6 升級到 7.0 時,必須從 MySQL 過渡到 MySQLi。這...

21 Jul 2016
如何跨站抓取別的網站的頁面的補充。在實際的應用中,經常會遇到一些特殊的情況,例如需要新聞,天氣預報,等等,但是作為個人站點或實力小的站點 我們不可能有那麼多

21 Jul 2016
一個從別的網站抓取資訊的例子(網域查詢)。 ? if (isset($xx)) { $dodo=@file(http://www.e9china.com/cgi-bin/comdns.pl?raw=1fqdn=.$fqdn.quot;.$domain.quot; .$root.quot;); $i=0; while($dodo[$i]) { echo $dodo[$i]; $i ; } exit; }

24 Dec 2024
了解 Python 類別繼承在 Python 中,類別可以從其他類別繼承,這使它們能夠存取父類別的屬性並...

21 Jul 2016
PHP5試用(二)。抽象類別 抽象類別不能被實例化。 抽象類別與其它類別一樣,允許定義變數及方法。 抽象類別同樣可以定義一個抽象的方法,抽象類別的方法不會被執


Hot Tools
