2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？-人工智慧-PHP中文網

撰稿丨諾亞

出品 | 51CTO技術堆疊（微訊號：blog51cto）

#Google有點流年不利。

在過去兩天裡，搜尋引擎提供了關於「AI 摘要（AI Overviews）」功能經常提供嚴重錯誤的搜尋結果信息，例如，荒唐地建議用戶用膠水來防止披薩上的起司滑落。對此，CEO 皮查伊也不得不不承認這是大語言模型的幻覺所致，目前還沒有解決方案。

最近有Google搜尋引擎的一份內部文件洩露，可能首次向公眾展示了Google搜尋引擎的運作機制。此文首次發佈於本文，Google尚未就洩漏事件做出官方回應，也沒有對文件的真實性提出異議。

長期以來，Google作為當今網路上最著名的搜尋引擎，如何對網站進行排名的細節一直是個謎。而這次曝光事件提供了一個新視角，讓我們得以窺見谷歌高度保密的搜尋演算法系統，以及運作機制與Google先前的公開聲明裡相輔相成的地方。

1.2500頁洩漏檔案

Google的搜尋演算法或許是網路上最具影響力的系統，它決定了網站的生死存亡及網路內容的呈現形態。但谷歌究竟是如何對網站進行排名的具體細節，從來都是“黑箱”，雖然也有媒體、研究人員以及從事搜尋引擎優化工作的人士進行過種種猜測，但也只是盲人摸象。我們始終難以窺見完整的拼圖。

如今，據外媒The Verge報道，這起堪稱炸裂的洩漏事件似乎首次揭開了搜尋功能背後的神秘面紗，並暗示谷歌多年來並未完全誠實地公開其運作方式。到目前為止，谷歌尚未對有關文件真實性的多次置評請求作出回應。

從事SEO工作超過十年的Rand Fishkin是這起事件的主角。他透露，一位消息人士與他分享了長達2500頁的文件，希望藉此來揭露谷歌關於搜尋演算法運作方式所散佈的對外「謊言」。

根據Fishkin介紹，這些文件概述了Google的搜尋API，並分解了提供給員工的資訊內容。 Fishkin分享的細節繁複且技術性強，對於開發者和SEO專家來說可能比普通人更容易理解。

洩漏內容本身並不一定證明Google使用了特定資料和訊號來進行搜尋排名。相反，洩漏文件概述了谷歌從網頁、網站和搜尋者收集了哪些數據，並間接向SEO專家提供了關於谷歌關注點的線索。

2.與Google公開聲明相矛盾

正如SEO專家Mike King在其對文件概述中所寫的那樣，洩露的文件涉及多個主題，如Google收集和使用的資料類型、Google針對選舉等敏感話題如何提升某些網站的權重、Google如何處理小型網站等。

更值得關注的是，根據Fishkin和Mike King所述，文件中的某些資訊似乎與Google的公開聲明相矛盾。

「說『說謊』可能太過嚴重，但在這種情況下，這是最貼切的說法，」Mike King這樣表述：「我理解谷歌的公關人員為了保護公司秘密所做的努力，但我不能接受的是，他們會去貶低那些在行銷、科技和新聞領域內，發現並提出質疑的人。尚未就涉及這些文件的The Verge的置評請求做出回應，其中包括直接要求反駁文件的真實性。 Fishkin在給The Verge的電子郵件中表示，谷歌並未對洩露的真實性提出異議，但有一位員工要求他更改帖子中關於某個事件描述的部分措辭。

Google保密的搜尋演算法催生了一個由行銷者組成的行業，他們緊跟著Google的公開指南，為全世界數百萬公司實踐SEO策略。然而，這些廣泛應用的手段，逐漸使人們普遍感覺到：Google的搜尋結果正每況愈下，充滿了垃圾訊息。

網站經營者感覺不得不生產這類內容以使自己的網站被看到。但面對這樣的質疑，Google的對外發言人總是會搬離一套熟悉的說詞：我們的指南並非如此指示。

但洩漏文件中的某些細節讓人質疑Google關於搜尋功能運作方式的公開聲明的準確性。

Fishkin和Mike King引用的一個例子是Google是否在排名中使用Chrome資料。谷歌代表多次表示不使用Chrome數據來排名頁面，但Chrome在關於網站如何出現在搜尋中的部分被特別提及。

圖片

2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？ #在上面的截圖中，根據檔案顯示，主要vogue.com網址下方出現的連結部分可能就是利用Chrome資料創建的。

另一個引起關注的問題是E-A-T（專業知識、權威性和可信度）在排名中扮演的角色。眾所周知，多年來E-A-T一直是Google搜尋品質評估指南的基石。

Google的代表先前曾表示，E-A-T並不是排名因素。 Fishkin指出，他在文件中沒有找到太多直接提到E-A-T的內容。

還有，Google的代表以前曾堅稱，署名是網站所有者應該為讀者而不是為谷歌做的，因為它不影響排名。但似乎並非如此。

邁克金詳述了谷歌如何收集頁面的作者數據，並指出文件中存在一個用於辨識實體是否為作者的字段，該字段雖主要為新聞文章設計，但也涵蓋其他諸如科學文章的內容。儘管這並不能證實署名是明確的排名要素之一，但它確實表明Google至少在密切追蹤這一屬性。

3.搜尋演算法革新，從此網路生態「變天」

儘管這些文件並非確鑿無疑的證據，但它們提供了一個深度且未經過濾的視角，讓我們得以窺見這個高度保密的黑箱系統。

事實上，在過去的兩年裡，Google搜尋經歷了一系列重大更新，有些甚至是前所未有的顛覆式更新。例如本文開頭提到的，飽受批評的「AI概覽」功能就是很有代表性的革新之一。

變革之初，Google掌舵人皮查伊表示，未來Google搜尋將為你的許多問題提供自己生成的AI答案，並對這一產品功能表達了強大的信心。

Google的一位發言人曾告訴BBC，公司只有在經過嚴格測試，確認變化對用戶有益後才會推出搜尋變更，並且公司為網站所有者提供了幫助、資源和就其搜尋排名回饋的機會。

但現實總是脫軌於理想。

無論是關於AI概覽功能的“致命幻覺”，還是在這份疑似洩露文件裡傳達出的“表裡不一”的信息，都在引發人們對於谷歌搜索的猜疑與警惕。

回顧整個網路發展史，沒有哪一家企業像Google一樣，不僅改變了這個藍星上大多數人獲取資訊的方式，也重塑了內容創造和分發的格局。

就用生成式AI加持搜尋舉例，Google似乎志在透過這些技術革新來更有效率地連結使用者與訊息，提升搜尋體驗的整體品質。

但事實上，正如批評者所說，這種轉變可能加劇資訊同質化，減少用戶探索網路的深度和廣度，因為他們越來越依賴谷歌直接提供的簡短答案，而不是親自訪問來源網站。這不僅可能削弱獨立網站和部落格的可見度及獲利模式，還可能影響網路生態的健康和多樣性，限制了用戶接觸多元觀點和深入分析的機會。

對強大如Google的搜尋玩家來說，如何確保搜尋演算法最佳化既能服務大眾，又不會破壞那些為網路貢獻高品質內容的生態基石，也許才是能夠長遠發展的根本所在。

參考連結：

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents -link-seo

//m.sbmmt.com/link/c30ca4400db3c72274c8ad819f688c21

想了解更多AIGC的內容，請造訪：

51CTO AI.x社群

https://www.51cto.com/aigc/

以上是2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？的詳細內容。更多資訊請關注PHP中文網其他相關文章！