Java HTML 解析
在使用網頁抓取應用程式時,有必要從 HTML 頁面中有效地提取資料。在此場景中,任務是從具有給定 CSS 類別名稱的特定 DIV 標籤取得資料。雖然目前在每行 HTML 中搜尋類別名稱的方法是有效的,但它可能不是最佳的。
Jsoup 作為替代方案
考慮使用 Jsoup HTML 處理庫。 Jsoup 旨在處理格式錯誤的 HTML,並提供了使用類似 jQuery 的標籤選擇器在 Java 中解析 HTML 的便捷語法。
使用 Jsoup
要使用 Jsoup,請依照以下步驟操作步驟:
例如:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; Document doc = Jsoup.parse(html); Elements divs = doc.select("div.classname"); for (Element div : divs) { if (div.hasClass("classname")) { System.out.println("Text: " + div.text()); System.out.println("Link: " + div.attr("href")); } }</code>
以上是如何在Java中高效率地從具有特定類別名稱的HTML DIV標籤中提取資料?的詳細內容。更多資訊請關注PHP中文網其他相關文章!