<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
'image' => array('img','src')
))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
'link' => array('a','href')
))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
'title' => array('h1','text'),
'date' => array('.pt_info','text','-span -a',function($content){
$arr = explode(' ',$content);
return $arr[0];
}),
'content' => array('.post_content','html','a -.content_copyright -script',function($content){
$doc = phpQuery::newDocumentHTML($content);
$imgs = pq($doc)->find('img');
foreach ($imgs as $img) {
$src = 'http://cms.querylist.cc'.pq($img)->attr('src');
$localSrc = 'w/'.md5($src).'.jpg';
$stream = file_get_contents($src);
file_put_contents($localSrc,$stream);
pq($img)->attr('src',$localSrc);
}
return $doc->htmlOuter();
})
);
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.
Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: [email protected]
Penyelesaian kepada kod status 406 apabila python meminta perpustakaan mengendalikan log masuk ke laman web dan merangkak data
07 Nov 2025
Tutorial ini bertujuan untuk menyelesaikan masalah menghadapi 406 tidak boleh diterima atau permintaan yang ditolak apabila menggunakan Perpustakaan Permintaan Python untuk merangkak data dari laman web yang memerlukan log masuk. Inti adalah untuk mensimulasikan tingkah laku penyemak imbas dan menambah tajuk permintaan HTTP yang diperlukan (seperti ejen pengguna, menerima, dll) kepada permintaan pos, dengan itu berjaya melangkaui mekanisme anti-crawling laman web dan mencapai pemerolehan data yang berkesan.
PHP Muat turun Imej: Menyelesaikan Kegagalan merangkak laman web tertentu dan sekatan ejen pengguna
11 Dec 2025
Tutorial ini bertujuan untuk menyelesaikan masalah kegagalan file_get_contents yang dihadapi oleh PHP apabila memuat turun imej dari laman web tertentu, terutamanya apabila pelayan menolak permintaan kerana ejen pengguna yang hilang atau diiktiraf. Artikel ini akan menerangkan secara mendalam bagaimana menggunakan stream_context_create untuk menambah tajuk permintaan http tersuai (terutamanya agen pengguna) ke kaedah file_get_contents, dengan itu berjaya melangkaui sekatan pelayan dan mencapai muat turun imej yang stabil dan cekap. Kandungan meliputi kaedah muat turun mudah, konfigurasi header permintaan lanjutan dan langkah berjaga -jaga yang berkaitan.
Bagaimana untuk menyemak pengguna yang kini wujud dalam pangkalan data MongoDB
14 Apr 2026
db.getUsers() mengembalikan senarai pengguna tempatan pangkalan data semasa. Anda perlu menggunakan use untuk beralih ke perpustakaan sasaran (seperti pentadbir atau perpustakaan perniagaan) terlebih dahulu. Pengguna perpustakaan lain atau pengguna peringkat kluster tidak dipaparkan; keputusan kosong selalunya disebabkan oleh ralat penukaran perpustakaan, kebenaran tidak mencukupi atau Sekatan pengesahan.
Cara Redis mengendalikan kunci tamat tempoh daripada pangkalan data hamba_Bergantung pada pangkalan data induk untuk menghantar arahan DEL untuk memastikan pemadaman konsisten data tuan-hamba
19 Mar 2026
Pustaka hamba tidak memadamkan kunci tamat tempoh secara aktif, tetapi hanya menyegerakkan arahan DEL dengan perpustakaan induk untuk mencapai konsistensi akhir; perpustakaan induk bertanggungjawab untuk semua penghakiman tamat tempoh dan pemadaman, dan menyebarkan DEL dan arahan lain ke perpustakaan hamba untuk dilaksanakan.
Cara Berinteraksi dengan Twitter (X) API V2 di Python
22 Nov 2025
Jawapannya ialah menggunakan pengesahan Bearertoken atau OAuth2.0 dan hubungi XAPIV2 melalui perpustakaan Tweepy atau Permintaan. Mula -mula membuat aplikasi pada platform pemaju dan dapatkan kunci, pasangkan perpustakaan tweepy atau permintaan, dan kemudian gunakan klien tweepy atau permintaan untuk menghantar permintaan, seperti mencari tweet baru -baru ini, mendapatkan maklumat pengguna, dan lain -lain. Perhatikan kebenaran API dan had kadar.
Cara Membuat Metrik Prometheus Custom dalam Aplikasi Golang
15 Nov 2025
Jawapannya adalah untuk memperkenalkan Perpustakaan Pelanggan Prometheusgo, menentukan petunjuk tersuai seperti kaunter, tolok, dan lain -lain, mendaftar dan membenamkannya dalam pemproses HTTP, dan akhirnya mendedahkan data melalui titik akhir /metrik untuk membuat Prometheus crawlable.
Alat popular
Koleksi 50 algoritma PHP klasik yang sangat baik
Algoritma PHP klasik, pelajari idea yang sangat baik dan kembangkan pemikiran anda
Pustaka PHP untuk bekas suntikan kebergantungan
Pustaka PHP untuk bekas suntikan kebergantungan
Pustaka PHP kecil untuk mengoptimumkan imej
Pustaka PHP kecil untuk mengoptimumkan imej




