2,500 muka surat dokumen algoritma bocor! Kotak hitam paling berkuasa dalam sejarah carian terdedah, adakah Google akan membatalkan dan menaik taraf semula?-AI-php.cn

Ditulis oleh Noah

Dihasilkan | 51CTO Technology Stack (WeChat ID: blog51cto)

Google mengalami tahun yang agak teruk.

Sejak dua hari lalu, ciri "Ikhtisar AI" enjin carian kerap memberikan maklumat hasil carian yang tidak tepat, contohnya, secara tidak masuk akal mencadangkan pengguna menggunakan gam untuk menghalang keju daripada tergelincir dari piza. Dalam hal ini, Ketua Pegawai Eksekutif Pichai juga terpaksa mengakui bahawa ini disebabkan oleh ilusi model bahasa yang besar, dan pada masa ini tiada penyelesaian.

Dokumen dalaman enjin carian Google telah bocor baru-baru ini, yang mungkin menunjukkan mekanisme pengendalian enjin carian Google kepada orang ramai buat kali pertama. Artikel ini pertama kali diterbitkan di sini Google masih belum mengeluarkan respons rasmi terhadap kebocoran itu dan tidak mempertikaikan kesahihan dokumen tersebut.

Butiran tentang cara Google, enjin carian paling terkenal di internet hari ini, meletakkan kedudukan laman web telah lama menjadi misteri. Pendedahan ini memberikan perspektif baharu, membolehkan kami melihat sekilas sistem algoritma carian Google yang sangat sulit, dan cara mekanisme pengendaliannya melengkapkan kenyataan awam Google sebelum ini.

1.2500 halaman dokumen yang bocor

Algoritma carian Google mungkin merupakan sistem yang paling berpengaruh di Internet. Ia menentukan kemandirian tapak web dan persembahan kandungan dalam talian. Walau bagaimanapun, butiran khusus tentang cara Google meletakkan kedudukan laman web sentiasa menjadi "kotak hitam" Walaupun terdapat pelbagai spekulasi oleh media, penyelidik, dan orang yang terlibat dalam pengoptimuman enjin carian, ini hanyalah orang buta yang cuba mencari tahu tentang gajah. . Kami tidak pernah melihat teka-teki yang lengkap.

Kini, menurut media asing The Verge, kebocoran letupan ini nampaknya telah mendedahkan misteri di sebalik fungsi carian buat kali pertama, dan mencadangkan bahawa Google tidak jujur sepenuhnya tentang cara ia berfungsi selama bertahun-tahun. Google setakat ini tidak menjawab beberapa permintaan untuk mengulas tentang ketulenan dokumen tersebut.

Rand Fishkin, yang telah bekerja dalam SEO selama lebih dari sepuluh tahun, adalah protagonis kejadian ini. Dia mendedahkan bahawa sumber berkongsi 2,500 halaman dokumen dengannya dengan harapan dapat mendedahkan "pembohongan" luaran Google tentang cara algoritma cariannya berfungsi.

Menurut Fishkin, dokumen ini menggariskan API carian Google dan memecahkan kandungan maklumat yang diberikan kepada pekerja. Butiran yang dikongsi Fishkin adalah kompleks dan teknikal, dan mungkin lebih mudah untuk difahami oleh pembangun dan pakar SEO berbanding orang biasa.

Kebocoran dengan sendirinya tidak semestinya membuktikan bahawa Google menggunakan data dan isyarat khusus untuk kedudukan carian. Sebaliknya, dokumen yang bocor menggariskan data yang Google kumpulkan daripada halaman web, tapak dan pencari, dan secara tidak langsung memberikan petunjuk kepada pakar SEO tentang fokus Google. . pilihan raya termasuk cara meningkatkan kuasa tapak web tertentu, cara Google mengendalikan tapak web kecil, dsb.

Lebih membimbangkan, menurut Fishkin dan Mike King, beberapa maklumat dalam dokumen itu nampaknya bercanggah dengan kenyataan awam Google.

"Mungkin terlalu serius untuk mengatakan 'berbohong', tetapi dalam kes ini, ia adalah perkataan yang paling sesuai," Mike King menyatakannya seperti ini: "Saya faham usaha orang perhubungan awam Google untuk melindungi rahsia syarikat, Tetapi apa yang saya tidak boleh terima ialah mereka akan memperlekehkan mereka dalam bidang pemasaran, teknologi dan kewartawanan yang mencari dan mengemukakan soalan.” Google masih belum menjawab permintaan The Verge untuk mengulas mengenai dokumen tersebut menyangkal kesahihan dokumen. Fishkin berkata dalam e-mel kepada The Verge bahawa Google tidak mempertikaikan kesahihan kebocoran itu, tetapi seorang pekerja memintanya menukar beberapa perkataan dalam siarannya tentang insiden.

Algoritma carian rahsia Google telah melahirkan industri pemasar yang mengikuti garis panduan awam Google dan mengamalkan strategi SEO untuk berjuta-juta syarikat di seluruh dunia. Walau bagaimanapun, kaedah yang digunakan secara meluas ini secara beransur-ansur membuatkan orang ramai merasakan bahawa hasil carian Google semakin merosot dan penuh dengan maklumat spam.

Pengendali tapak web berasa terdorong untuk menghasilkan jenis kandungan ini untuk melihat tapak mereka. Tetapi dalam menghadapi keraguan sedemikian, jurucakap luar Google akan sentiasa menghasilkan set retorik yang biasa: Garis panduan kami tidak menunjukkan perkara ini.

Tetapi beberapa butiran dalam dokumen yang bocor menimbulkan keraguan tentang ketepatan kenyataan awam Google tentang cara ciri cariannya berfungsi.

Salah satu contoh yang dipetik oleh Fishkin dan Mike King ialah sama ada Google menggunakan data Chrome dalam kedudukan. Wakil Google telah berulang kali menyatakan bahawa data Chrome tidak digunakan untuk menentukan kedudukan halaman, tetapi Chrome disebut secara khusus dalam bahagian tentang cara tapak muncul dalam carian.

Gambar

Dalam tangkapan skrin di atas, mengikut dokumen, pautan yang muncul di bawah URL vogue.com utama mungkin telah dibuat menggunakan data Chrome.

2,500 muka surat dokumen algoritma bocor! Kotak hitam paling berkuasa dalam sejarah carian terdedah, adakah Google akan membatalkan dan menaik taraf semula?

Satu lagi isu yang membimbangkan ialah peranan E-A-T (Kepakaran, Kuasa dan Kebolehpercayaan) dalam kedudukan. Seperti yang kita sedia maklum, E-A-T telah menjadi asas kepada garis panduan penilaian kualiti carian Google selama bertahun-tahun.

Wakil Google sebelum ini telah menyatakan bahawa E-A-T bukanlah faktor ranking. Fishkin menyatakan bahawa dia tidak menemui banyak rujukan langsung kepada E-A-T dalam dokumen.

Selain itu, wakil Google sebelum ini menegaskan bahawa atribusi ialah sesuatu yang harus dilakukan oleh pemilik tapak web untuk pembaca, bukan Google, kerana ia tidak menjejaskan kedudukan. Tetapi itu nampaknya tidak berlaku.

Mike King memperincikan cara Google mengumpul data pengarang untuk halaman, dan menunjukkan bahawa terdapat medan dalam fail yang digunakan untuk mengenal pasti sama ada sesuatu entiti ialah pengarang Walaupun medan ini direka khas untuk artikel berita, ia juga meliputi yang lain seperti artikel ilmiah. Walaupun ini tidak mengesahkan bahawa atribusi ialah faktor kedudukan yang jelas, ini menunjukkan bahawa Google sekurang-kurangnya menjejaki atribut ini dengan teliti.

3. Inovasi algoritma carian, ekosistem Internet telah "berubah" sejak itu

Walaupun dokumen ini bukan bukti muktamad, ia memberikan perspektif yang mendalam dan tidak ditapis, membolehkan kami mengintip sistem kotak hitam yang sangat sulit ini .

Malah, dalam tempoh dua tahun yang lalu, Carian Google telah mengalami beberapa siri kemas kini utama, malah sebahagian daripadanya merupakan kemas kini mengganggu yang belum pernah terjadi sebelumnya. Sebagai contoh, yang disebut pada permulaan artikel ini, fungsi "Tinjauan Keseluruhan AI" yang banyak dikritik adalah salah satu inovasi yang paling mewakili.

Pada permulaan perubahan, Pichai, ketua Google, berkata bahawa pada masa hadapan, carian Google akan memberikan jawapan AI yang dijana sendiri kepada banyak soalan anda, dan menyatakan keyakinan yang kuat terhadap fungsi produk ini.

Seorang jurucakap Google memberitahu BBC bahawa syarikat itu hanya akan melancarkan perubahan carian selepas ujian yang ketat untuk mengesahkan bahawa perubahan itu akan memberi manfaat kepada pengguna, dan syarikat itu memberikan bantuan, sumber dan maklum balas kepada pemilik tapak web tentang Peluang kedudukan carian mereka.

Tetapi realiti sentiasa menyimpang dari ideal.

Sama ada "halusinasi maut" tentang fungsi gambaran keseluruhan AI atau maklumat "tidak konsisten" yang disampaikan dalam dokumen yang disyaki bocor ini, ia menimbulkan kecurigaan dan kewaspadaan orang ramai tentang carian Google.

Mengimbas kembali keseluruhan sejarah perkembangan Internet, tiada syarikat seperti Google bukan sahaja mengubah cara kebanyakan orang di bintang biru ini mendapatkan maklumat, tetapi juga membentuk semula corak penciptaan dan pengedaran kandungan.

Ambil carian dikuasakan AI generatif sebagai contoh Google nampaknya mensasarkan untuk menggunakan inovasi teknologi ini untuk menghubungkan pengguna dan maklumat dengan lebih cekap serta meningkatkan kualiti keseluruhan pengalaman carian.

Tetapi sebenarnya, seperti yang dikatakan pengkritik, anjakan ini boleh memburukkan lagi kehomogenan maklumat dan mengurangkan kedalaman dan keluasan penerokaan web pengguna, kerana mereka semakin bergantung pada jawapan ringkas yang diberikan secara langsung oleh Google dan bukannya secara peribadi Lawati sumber laman web. Ini bukan sahaja boleh melemahkan keterlihatan dan model keuntungan tapak web dan blog bebas, tetapi juga boleh menjejaskan kesihatan dan kepelbagaian ekosistem dalam talian, mengehadkan peluang pengguna untuk pendedahan kepada pelbagai sudut pandangan dan analisis mendalam.

Bagi pemain carian sehebat Google, cara memastikan pengoptimuman algoritma carian bukan sahaja dapat memberi perkhidmatan kepada orang ramai tetapi tidak memusnahkan asas ekologi yang menyumbang kandungan berkualiti tinggi kepada Internet mungkin menjadi kunci kepada pembangunan jangka panjang.

Pautan rujukan:

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo

wwwhttps:// .php.cn/link/c30ca4400db3c72274c8ad819f688c21

Untuk mengetahui lebih lanjut tentang AIGC, sila layari:

51CTO AI.x Community

https://www.51cto.com

/aig

Atas ialah kandungan terperinci 2,500 muka surat dokumen algoritma bocor! Kotak hitam paling berkuasa dalam sejarah carian terdedah, adakah Google akan membatalkan dan menaik taraf semula?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!