網站的Selenium 偵測
雖然Selenium 與Chromedriver 提供瀏覽器自動化,但某些網站具有偵測何時使用selenium 實例的能力,儘管沒有明確的自動化。這種能力提出了這些網站如何完成這種檢測的問題。
偵測技術
網站採用各種技術來辨識 Selenium 的存在。一種流行的方法是檢查 Selenium 運行時出現的預定義 JavaScript 變數。這些變數經常包含術語“selenium”或“webdriver”,並且可以在視窗物件和文件變數(例如 $cdc_ 和 $wdc_)中檢測到。檢測機制因所使用的瀏覽器而異。
對策
要規避網站檢測,一種方法是消除或更改特定 JavaScript 變數的存在。例如,在 Chrome 中,修改 chromedriver 原始碼以將 $cdc_ 更改為不同的變數名稱已被發現是有效的。
用於機器人偵測的偽代碼
某些機器人網路可能會利用複雜的演算法來偵測 Selenium 的使用情況。以下偽程式碼讓我們一窺潛在的偵測技術:
runBotDetection = function () { // Check for window-specific detection keys for (windowDetectionKey in windowDetectionKeys) { if (window[windowDetectionKeyValue]) { return true; } } // Check for document-specific detection keys for (documentDetectionKey in documentDetectionKeys) { if (window['document'][documentDetectionKeyValue]) { return true; } } // Inspect document for specific patterns for (documentKey in window['document']) { if (documentKey.match(/$[a-z]dc_/) && window['document'][documentKey]['cache_']) { return true; } } // Check for additional external indicators if (window['external'] && window['external'].toString() && (window['external'].toString()['indexOf']('Sequentum') != -1)) return true; // Examine HTML element attributes if (window['document']['documentElement']['getAttribute']('selenium')) return true; if (window['document']['documentElement']['getAttribute']('webdriver')) return true; if (window['document']['documentElement']['getAttribute']('driver')) return true; return false; };
其他方法
除了更改JavaScript 變數之外,其他逃避Selenium 偵測的技術還包括:
以上是網站如何偵測 Selenium 自動化,以及如何規避?的詳細內容。更多資訊請關注PHP中文網其他相關文章!