如何使用Python 擷取動態HTML 內容的值:綜合指南
嘗試使用下列指令從具有動態載入內容的網站擷取資料時在Python 中,您可能會遇到困難,即檢索到的佔位符範本文字取代了實際值。此問題源自於 BeautifulSoup 等傳統方法無法執行建立動態元素的 JavaScript 渲染。
要解決此問題,請考慮以下解決方案:
應用Selenium 和BeautifulSoup
檢索“中位數”使用Selenium 和BeautifulSoup 從提供的網站中獲取“值”,請按照以下步驟操作:
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('URL_OF_PAGE') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("class", "formatPrice median"): print(tag.text)</code>
此方法將模擬瀏覽器訪問網站,捕獲渲染的HTML,並使用BeautifulSoup 定位並提取“中位數” “值。
以上是如何在 Python 中存取動態 Web 內容值:有效的解決方案?的詳細內容。更多資訊請關注PHP中文網其他相關文章!