cari
  • Log masuk
  • Daftar
Penetapan semula kata laluan berjaya

Ikuti proiects vou berminat dengan andi aet terbaru mengenai mereka

Rumah Perpustakaan PHP Perpustakaan lain perpustakaan merangkak laman web php
php laman web merangkak perpustakaan
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.

Penafian

Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: [email protected]

Penyelesaian kepada kod status 406 apabila python meminta perpustakaan mengendalikan log masuk ke laman web dan merangkak data Penyelesaian kepada kod status 406 apabila python meminta perpustakaan mengendalikan log masuk ke laman web dan merangkak data

07 Nov 2025

Tutorial ini bertujuan untuk menyelesaikan masalah menghadapi 406 tidak boleh diterima atau permintaan yang ditolak apabila menggunakan Perpustakaan Permintaan Python untuk merangkak data dari laman web yang memerlukan log masuk. Inti adalah untuk mensimulasikan tingkah laku penyemak imbas dan menambah tajuk permintaan HTTP yang diperlukan (seperti ejen pengguna, menerima, dll) kepada permintaan pos, dengan itu berjaya melangkaui mekanisme anti-crawling laman web dan mencapai pemerolehan data yang berkesan.

PHP Muat turun Imej: Menyelesaikan Kegagalan merangkak laman web tertentu dan sekatan ejen pengguna PHP Muat turun Imej: Menyelesaikan Kegagalan merangkak laman web tertentu dan sekatan ejen pengguna

11 Dec 2025

Tutorial ini bertujuan untuk menyelesaikan masalah kegagalan file_get_contents yang dihadapi oleh PHP apabila memuat turun imej dari laman web tertentu, terutamanya apabila pelayan menolak permintaan kerana ejen pengguna yang hilang atau diiktiraf. Artikel ini akan menerangkan secara mendalam bagaimana menggunakan stream_context_create untuk menambah tajuk permintaan http tersuai (terutamanya agen pengguna) ke kaedah file_get_contents, dengan itu berjaya melangkaui sekatan pelayan dan mencapai muat turun imej yang stabil dan cekap. Kandungan meliputi kaedah muat turun mudah, konfigurasi header permintaan lanjutan dan langkah berjaga -jaga yang berkaitan.

Bagaimana untuk menyemak pengguna yang kini wujud dalam pangkalan data MongoDB Bagaimana untuk menyemak pengguna yang kini wujud dalam pangkalan data MongoDB

14 Apr 2026

db.getUsers() mengembalikan senarai pengguna tempatan pangkalan data semasa. Anda perlu menggunakan use untuk beralih ke perpustakaan sasaran (seperti pentadbir atau perpustakaan perniagaan) terlebih dahulu. Pengguna perpustakaan lain atau pengguna peringkat kluster tidak dipaparkan; keputusan kosong selalunya disebabkan oleh ralat penukaran perpustakaan, kebenaran tidak mencukupi atau Sekatan pengesahan.

Cara Redis mengendalikan kunci tamat tempoh daripada pangkalan data hamba_Bergantung pada pangkalan data induk untuk menghantar arahan DEL untuk memastikan pemadaman konsisten data tuan-hamba Cara Redis mengendalikan kunci tamat tempoh daripada pangkalan data hamba_Bergantung pada pangkalan data induk untuk menghantar arahan DEL untuk memastikan pemadaman konsisten data tuan-hamba

19 Mar 2026

Pustaka hamba tidak memadamkan kunci tamat tempoh secara aktif, tetapi hanya menyegerakkan arahan DEL dengan perpustakaan induk untuk mencapai konsistensi akhir; perpustakaan induk bertanggungjawab untuk semua penghakiman tamat tempoh dan pemadaman, dan menyebarkan DEL dan arahan lain ke perpustakaan hamba untuk dilaksanakan.

Cara Berinteraksi dengan Twitter (X) API V2 di Python Cara Berinteraksi dengan Twitter (X) API V2 di Python

22 Nov 2025

Jawapannya ialah menggunakan pengesahan Bearertoken atau OAuth2.0 dan hubungi XAPIV2 melalui perpustakaan Tweepy atau Permintaan. Mula -mula membuat aplikasi pada platform pemaju dan dapatkan kunci, pasangkan perpustakaan tweepy atau permintaan, dan kemudian gunakan klien tweepy atau permintaan untuk menghantar permintaan, seperti mencari tweet baru -baru ini, mendapatkan maklumat pengguna, dan lain -lain. Perhatikan kebenaran API dan had kadar.

Cara Membuat Metrik Prometheus Custom dalam Aplikasi Golang Cara Membuat Metrik Prometheus Custom dalam Aplikasi Golang

15 Nov 2025

Jawapannya adalah untuk memperkenalkan Perpustakaan Pelanggan Prometheusgo, menentukan petunjuk tersuai seperti kaunter, tolok, dan lain -lain, mendaftar dan membenamkannya dalam pemproses HTTP, dan akhirnya mendedahkan data melalui titik akhir /metrik untuk membuat Prometheus crawlable.

Tunjukkan Lagi