網路爬蟲過程中無法定位HTML元素。該元素在網站檢查工具中可見

Question

我正在嘗試從此URL中爬取所有表格的標題：https://www.nature.com/articles/s41586-023-06192-4我可以在網站上找到這個HTML元素：Table1CalculatedCt–M–Ctangles我無法爬取這個標題

P粉920485285 · Answer

所以你使用的程式碼看起來沒問題，我想到的問題是，網站可能是透過JavaScript或某個XHR呼叫來載入你要爬取的那個元素，因此當你使用requests函式庫發送請求時，它無法獲取到那個元素。

解決這個問題的方法是，試著使用Selenium，用selenium開啟網站，然後將頁面原始碼載入到bs4中，這樣你的程式碼就能正常運作了。

注意：當整個網站載入完畢後，將頁面原始碼載入到bs4。你還需要使用selenium建立一個登入功能，因為這個網站需要登入才能查看內容。

php8，我來也