Rumah > pembangunan bahagian belakang > tutorial php > Imej mengikis dengan symfony ' s domcrawler

Imej mengikis dengan symfony ' s domcrawler

Jennifer Aniston
Lepaskan: 2025-02-21 08:47:11
asal
522 orang telah melayarinya

Imej mengikis dengan symfony ' s domcrawler

Rakan jurugambar saya meminta saya mencari dan memuat turun imej bingkai gambar dari internet. Saya akhirnya mendarat di laman web yang mempunyai beberapa daripada mereka yang tersedia secara percuma tetapi ada masalah: pautan untuk memuat turun semua imej bersama -sama tidak hadir.

Saya tidak mahu melalui tekanan memuat turun imej secara individu, jadi saya menulis kelas PHP ini untuk mencari, memuat turun dan zip semua imej yang terdapat di laman web.

Takeaways Key

    Kelas PHP menggunakan komponen Domcrawler Symfony untuk mengikis imej dari laman web, memuat turun dan simpannya ke dalam folder, membuat arkib zip folder, dan kemudian memadam folder. Kelas ini direka untuk mengautomasikan proses memuat turun pelbagai imej dari laman web.
  • Kelas termasuk lima sifat peribadi dan lapan kaedah awam. Properties menyimpan maklumat seperti nama folder, URL halaman web, kod dokumen HTML, nama fail zip, dan status operasi. Kaedah ini termasuk fungsi untuk menetapkan folder dan nama fail, instantiate domcrawler, muat turun dan simpan imej, buat fail zip, padamkan folder, dan dapatkan status operasi.
  • Untuk menggunakan kelas, semua fail yang diperlukan mesti dimasukkan, sama ada melalui autoload atau secara eksplisit. Kaedah setfolder dan setFileName harus dipanggil dengan argumen masing -masing, dan kaedah proses kemudian dipanggil untuk meletakkan kelas berfungsi. Komponen Domcrawler dan fungsi create_zip mesti dimasukkan untuk kelas berfungsi.
bagaimana kelas berfungsi

Ia mencari URL untuk imej, muat turun dan menyimpan imej ke dalam folder, membuat arkib zip folder dan akhirnya memadamkan folder.

Kelas menggunakan komponen Domcrawler Symfony untuk mencari semua pautan imej yang terdapat di laman web dan fungsi zip tersuai yang membuat fail zip. Kredit kepada David Walsh untuk fungsi zip.

pengekodan kelas

Kelas terdiri daripada lima sifat swasta dan lapan kaedah awam termasuk kaedah sihir __construct.

Imej mengikis dengan symfony ' s domcrawler di bawah adalah senarai sifat kelas dan peranan mereka.

1. $ Folder: Menyimpan nama folder yang mengandungi imej yang dikikis.

2. $ Url: Menyimpan URL halaman web.
3. $ HTML: Menyimpan kod dokumen HTML laman web yang akan dikikis.
4. $ FileName: Menyimpan nama fail zip.
5. Status $: Menjimatkan status operasi. I.e jika kejayaan atau kegagalan.

mari kita mulakan membina kelas.

Buat zipimages kelas yang mengandungi lima sifat di atas.

Buat kaedah sihir __construct yang menerima URL sebagai hujah.
<span><span><?php
</span></span><span><span>class ZipImages {
</span></span><span>    <span>private $folder;
</span></span><span>    <span>private $url;
</span></span><span>    <span>private $html;
</span></span><span>    <span>private $fileName;
</span></span><span>    <span>private $status;</span></span>
Salin selepas log masuk
Salin selepas log masuk
Kaedah ini agak jelas.


Arkib ZIP yang dicipta mempunyai folder yang mengandungi imej yang dikikis. Kaedah setfolder di bawah mengkonfigurasi ini.
<span>public function __construct($url) {
</span>    <span>$this->url = $url; 
</span>    <span>$this->html = file_get_contents($this->url);
</span>    <span>$this->setFolder();
</span><span>}</span>
Salin selepas log masuk
Salin selepas log masuk

Secara lalai, nama folder ditetapkan ke imej tetapi kaedah menyediakan pilihan untuk menukar nama folder dengan hanya lulus nama folder sebagai hujahnya.

<span><span><?php
</span></span><span><span>class ZipImages {
</span></span><span>    <span>private $folder;
</span></span><span>    <span>private $url;
</span></span><span>    <span>private $html;
</span></span><span>    <span>private $fileName;
</span></span><span>    <span>private $status;</span></span>
Salin selepas log masuk
Salin selepas log masuk

setFileName menyediakan pilihan untuk menukar nama fail zip dengan nama lalai yang ditetapkan ke zipimages:

<span>public function __construct($url) {
</span>    <span>$this->url = $url; 
</span>    <span>$this->html = file_get_contents($this->url);
</span>    <span>$this->setFolder();
</span><span>}</span>
Salin selepas log masuk
Salin selepas log masuk

Pada ketika ini, kami memberi contoh komponen perayap Symfony untuk mencari imej, kemudian muat turun dan simpan semua imej ke dalam folder.

<span>public function setFolder($folder="image") {
</span>    <span>// if folder doesn't exist, attempt to create one and store the folder name in property $folder
</span>    <span>if(!file_exists($folder)) {
</span>        <span>mkdir($folder);
</span>    <span>}
</span>    <span>$this->folder = $folder;
</span><span>}</span>
Salin selepas log masuk

Selepas muat turun selesai, kami memampatkan folder imej ke arkib zip menggunakan fungsi create_zip tersuai kami.

<span>public function setFileName($name = "zipImages") {
</span>    <span>$this->fileName = $name;
</span><span>}</span>
Salin selepas log masuk

Akhir sekali, kami memadam folder yang dibuat selepas fail zip telah dibuat.

<span>public function domCrawler() {
</span>    <span>//instantiate the symfony DomCrawler Component
</span>    <span>$crawler = new Crawler($this->html);
</span>    <span>// create an array of all scrapped image links
</span>    <span>$result = $crawler
</span>        <span>->filterXpath('//img')
</span>        <span>->extract(array('src'));
</span>
<span>// download and save the image to the folder 
</span>    <span>foreach ($result as $image) {
</span>        <span>$path = $this->folder."/".basename($image);
</span>        <span>$file = file_get_contents($image);
</span>        <span>$insert = file_put_contents($path, $file);
</span>        <span>if (!$insert) {
</span>            <span>throw new <span>\Exception</span>('Failed to write image');
</span>        <span>}
</span>    <span>}
</span><span>}</span>
Salin selepas log masuk

Dapatkan status operasi. I.e jika berjaya atau ralat berlaku.

<span>public function createZip() {
</span>    <span>$folderFiles = scandir($this->folder);
</span>    <span>if (!$folderFiles) {
</span>        <span>throw new <span>\Exception</span>('Failed to scan folder');
</span>    <span>}
</span>    <span>$fileArray = array();
</span>    <span>foreach($folderFiles as $file){
</span>        <span>if (($file != ".") && ($file != "..")) {
</span>            <span>$fileArray[] = $this->folder."/".$file;
</span>        <span>}
</span>    <span>}
</span>
    <span>if (create_zip($fileArray, $this->fileName.'.zip')) {
</span>        <span>$this->status = <span><span><<<HTML</span>
</span></span><span>File successfully archived. <a href="<span><span>$this->fileName</span>.zip">Download it now</a>
</span></span><span><span>HTML<span>;</span></span>
</span>    <span>} else {
</span>        <span>$this->status = "An error occurred";
</span>    <span>}
</span><span>}</span>
Salin selepas log masuk

Proses semua kaedah di atas.

<span>public function deleteCreatedFolder() {
</span>    <span>$dp = opendir($this->folder) or die ('ERROR: Cannot open directory');
</span>    <span>while ($file = readdir($dp)) {
</span>        <span>if ($file != '.' && $file != '..') {
</span>            <span>if (is_file("<span><span>$this->folder</span>/<span>$file</span>"</span>)) {
</span>                <span>unlink("<span><span>$this->folder</span>/<span>$file</span>"</span>);
</span>            <span>}
</span>        <span>}
</span>    <span>}
</span>    <span>rmdir($this->folder) or die ('could not delete folder');
</span><span>}</span>
Salin selepas log masuk

anda boleh memuat turun kelas penuh dari github.

KEGIATAN KELAS Untuk kelas berfungsi, komponen Domcrawler dan fungsi create_zip perlu dimasukkan. Anda boleh memuat turun kod untuk fungsi ini di sini.

Muat turun dan pasang komponen Domcrawler melalui komposer hanya dengan menambahkan pernyataan berikut yang memerlukan ke fail komposer.json anda:

<span>public function getStatus() {
</span>    <span>echo $this->status;
</span><span>}</span>
Salin selepas log masuk
run $ php composer.phar Pasang untuk memuat turun perpustakaan dan menghasilkan fail autoloader vendor/autoload.php.

menggunakan kelas

    Pastikan semua fail yang diperlukan dimasukkan, melalui autoload atau secara eksplisit.
  • Panggil setFolder, dan setFileName kaedah dan lulus dalam argumen masing -masing. Hanya hubungi kaedah setFolder apabila anda perlu menukar nama folder.
  • panggil kaedah proses untuk meletakkan kelas berfungsi.
<span>public function process() {
</span>    <span>$this->domCrawler();
</span>    <span>$this->createZip();
</span>    <span>$this->deleteCreatedFolder();
</span>    <span>$this->getStatus();
</span><span>}</span>
Salin selepas log masuk

Imej mengikis dengan symfony ' s domcrawler Ringkasan

Dalam artikel ini, kami belajar bagaimana untuk membuat pengikis imej PHP yang mudah yang secara automatik memampatkan imej yang dimuat turun ke dalam arkib zip. Sekiranya anda mempunyai penyelesaian alternatif atau cadangan untuk penambahbaikan, sila tinggalkannya dalam komen di bawah, semua maklum balas dialu -alukan!

Soalan Lazim (Soalan Lazim) Mengenai Imej Mengikis dengan Symfony's Domcrawler

Apakah komponen Domcrawler Symfony? Ia menyediakan API yang mudah digunakan dan difahami, menjadikannya pilihan yang popular untuk tugas mengikis web. Komponen Domcrawler boleh digunakan untuk memilih unsur -unsur tertentu pada halaman, mengekstrak data dari mereka, dan juga mengubah kandungan mereka. langsung. Anda boleh menggunakan komposer, alat pengurusan ketergantungan untuk PHP. Jalankan arahan berikut dalam direktori projek anda: Komposer memerlukan Symfony/Dom-Crawler. Ini akan memuat turun dan memasang komponen Domcrawler bersama -sama dengan kebergantungannya.

Bagaimana saya menggunakan komponen Domcrawler Symfony untuk mengikis imej? Kemudian, anda boleh menggunakan kaedah penapis untuk memilih elemen imej dan mengeluarkan atribut SRC mereka. Berikut adalah contoh asas:

$ crawler = crawler baru ($ html);
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) {
echo $ node-> attr ('src'); Ya, anda boleh menggunakan komponen Domcrawler Symfony dengan Laravel. Fungsi ujian HTTP Laravel sebenarnya menggunakan komponen Domcrawler di bawah tudung. Ini bermakna anda boleh menggunakan kaedah dan teknik yang sama untuk melintasi dan memanipulasi kandungan HTML dalam ujian laravel anda. Pilih Elemen, termasuk Filter, FilterXPath, dan SelectLink. Kaedah ini membolehkan anda memilih elemen berdasarkan nama tag mereka, ekspresi xpath, atau teks pautan. Ubah suai kandungan elemen menggunakan komponen Domcrawler Symfony. Kaedah setiap membolehkan anda melelehkan setiap elemen yang dipilih dan melaksanakan operasi di atasnya. Sebagai contoh, anda boleh menukar atribut src elemen imej seperti ini:

$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) { $ node-> attr ('src', 'baru-image.jpg'); ); Komponen Domcrawler?

Apabila menggunakan komponen, kesilapan dan pengecualian Domcrawler Symfony boleh dikendalikan menggunakan blok percubaan. Sebagai contoh, jika kaedah penapis tidak menemui sebarang unsur yang sepadan, ia akan membuang InvalidargumentException. Anda boleh menangkap pengecualian ini dan mengendalikannya dengan sewajarnya. Walau bagaimanapun, ini memerlukan langkah -langkah tambahan, seperti menghantar permintaan pos dengan kelayakan log masuk dan menyimpan cookie sesi. Nilai menggunakan kaedah ATTR yang disediakan oleh komponen Domcrawler Symfony. Sebagai contoh, untuk mengekstrak atribut Src elemen imej, anda boleh melakukan perkara berikut:

$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) { echo $ node-> attr ('src');

});

Bolehkah saya menggunakan komponen Domcrawler Symfony untuk mengikis kandungan yang dimuatkan oleh AJAX? Walau bagaimanapun, anda boleh menggunakan alat seperti Guzzle dan Goutte dalam kombinasi dengan komponen Domcrawler untuk menghantar permintaan HTTP dan mengendalikan kandungan yang dimuatkan oleh AJAX.

Atas ialah kandungan terperinci Imej mengikis dengan symfony ' s domcrawler. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan