Adakah Google akan merangkak JavaScript yang mengandungi kandungan badan?-tutorial js-php.cn

Adakah Google akan merangkak JavaScript yang mengandungi kandungan badan?

WBOY

Lepaskan： 2023-08-25 14:33:12

ke hadapan

821 orang telah melayarinya

Google 是否会抓取包含正文内容的 JavaScript

Secara sejarah, perangkak enjin carian seperti Googlebot hanya boleh membaca kod sumber HTML statik dan tidak dapat mengimbas dan mengindeks bahan yang ditulis secara dinamik menggunakan JavaScript. Walau bagaimanapun, ini telah berubah dengan peningkatan tapak web dan rangka kerja yang kaya dengan JavaScript seperti Angular, React dan Vue.JS, serta aplikasi satu halaman (SPA) dan aplikasi web progresif (PWA). Untuk memaparkan halaman web dengan betul sebelum mengindeksnya, Google mengubah suai dan menghentikan teknologi rangkak AJAX sebelumnya. Walaupun Google secara amnya boleh merangkak dan mengindeks kebanyakan maklumat JavaScript, mereka mengesyorkan agar tidak menggunakan penyelesaian pihak pelanggan kerana JavaScript "sukar untuk diproses dan tidak semua perangkak enjin carian boleh memprosesnya dengan betul atau cepat."

Apakah itu Google Fetch?

Google dan enjin carian lain menggunakan perisian yang dipanggil perangkak Google (juga dikenali sebagai bot carian atau labah-labah) untuk mengimbas web. Dalam erti kata lain, ia "merangkak" Internet dari halaman ke tapak web, mencari kandungan segar atau dikemas kini yang belum ada dalam pangkalan data Google.

Setiap enjin carian mempunyai koleksi perangkak yang unik. Untuk Google, terdapat lebih daripada 15 jenis perangkak yang berbeza, dengan Googlebot menjadi yang utama. Memandangkan Googlebot melakukan rangkak dan pengindeksan, kami akan memeriksa operasinya dengan lebih terperinci.

Bagaimanakah perangkak Google berfungsi?

Tiada enjin carian (termasuk Google) yang mengekalkan daftar pusat URL dan mengemas kini URL itu setiap kali halaman baharu dibuat. Ini bermakna Google perlu mencari di internet untuk halaman baharu, bukannya "memberitahu" mereka secara automatik. Googlebot sentiasa melayari Internet, mencari halaman web baharu untuk ditambahkan pada inventori halaman web sedia ada Google.

Setelah tapak web baharu ditemui, Googlebot memaparkan (atau "memvisualisasikan") tapak dalam penyemak imbas dengan memuatkan semua HTML, kod pihak ketiga, JavaScript dan CSS. Enjin carian menggunakan data ini yang disimpan dalam pangkalan data untuk mengindeks dan memberi kedudukan halaman. Halaman tersebut akan ditambahkan pada indeks Google, yang merupakan pangkalan data Google tambahan yang sangat besar jika diindeks.

JavaScript dan rendering HTML

Kod yang panjang lebar boleh menyukarkan Googlebot untuk memproses dan memberikannya. Jika kod itu tidak bersih, perangkak mungkin tidak dapat memaparkan tapak anda dengan betul, dalam hal ini ia akan dianggap sebagai kosong.

Berkenaan pemaparan JavaScript, sila ingat bahawa bahasa itu berkembang pesat dan Googlebot kadangkala berhenti menyokong versi terkini. Pastikan JavaScript anda serasi dengan Googlebot untuk mengelak daripada memaparkan tapak anda silap-silap. Pastikan JavaScript dimuatkan dengan cepat. Googlebot tidak akan memaparkan dan mengindeks bahan yang dijana skrip jika mengambil masa lebih lama daripada lima saat untuk dimuatkan.

Bila hendak menggunakan JavaScript untuk mengikis?

Kami masih mengesyorkan menggunakan JavaScript mengikis secara terpilih apabila mula-mula menganalisis tapak untuk JavaScript, walaupun Google biasanya akan memaparkan setiap halaman. JavaScript digunakan untuk memanfaatkan kebergantungan pelanggan yang diketahui untuk tujuan pengauditan dan semasa penggunaan di tapak besar.

Semua sumber (termasuk JavaScript, CSS dan imej) mesti dirangkak secara terpilih untuk memaparkan setiap halaman web dan membina DOM dalam penyemak imbas tanpa kepala di latar belakang. Merangkak JavaScript adalah lebih perlahan dan lebih intensif buruh.

Walaupun ini bukan masalah untuk tapak yang lebih kecil, ia boleh memberi kesan yang ketara pada tapak yang lebih besar dengan ratusan atau bahkan berjuta-juta halaman. Jika tapak web anda tidak banyak bergantung pada JavaScript untuk menukar halaman web secara dinamik, tidak perlu menghabiskan masa atau sumber.

Apabila berurusan dengan JavaScript dan halaman web dengan kandungan dinamik (DOM), perangkak mesti membaca dan menilai Model Objek Dokumen. Selepas semua kod dimuatkan dan diproses, versi yang dipaparkan sepenuhnya bagi tapak web sedemikian juga mesti dihasilkan. Pelayar ialah alat yang paling mudah untuk kami melihat halaman web yang dipaparkan. Atas sebab ini, JavaScript merangkak kadangkala digambarkan sebagai menggunakan "pelayar tanpa kepala."

Kesimpulan

Akan terdapat lebih banyak JavaScript pada tahun-tahun akan datang kerana ia akan kekal di sini. JavaScript boleh wujud bersama secara aman dengan SEO dan perangkak selagi anda membincangkannya dengan SEO lebih awal apabila mencipta seni bina tapak web anda. Perangkak masih hanyalah replika tingkah laku bot enjin carian sebenar. Selain perangkak JavaScript, kami amat mengesyorkan anda menggunakan analisis fail log, alat pemeriksaan URL Google atau alat ujian mesra mudah alih untuk memahami perkara yang boleh dirangkak, dipaparkan dan diindeks oleh Google.

Atas ialah kandungan terperinci Adakah Google akan merangkak JavaScript yang mengandungi kandungan badan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!