首頁 > 後端開發 > php教程 > 如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?

如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?

Linda Hamilton
發布: 2024-10-31 13:14:20
原創
617 人瀏覽過

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

使用PHP 的DOMDocument 和XPath 解析HTML

嘗試使用PHP 的DOMDocument 解析問題是在以下標籤中尋找一個常見標籤特定文本特定的課程。在這種情況下,單獨使用 DOMDocument::getElementsByTagName 可能不夠。

要擷取目標類別標籤內的特定文本,建議使用 DOMDocument 和 DOMXPath 的替代方法。 DOMXPath 允許強大的 XPath 查詢根據元素的屬性和結構來定位元素。

考慮以下 HTML:

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>
登入後複製

要擷取

中的文字class="text" 的標籤是
的後代。 class="main" 的標籤,請依照以下步驟操作:
php
$html = <<loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}
登入後複製

此程式碼片段將輸出:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)
登入後複製

透過利用DOMDocument 和DOMXPath,您可以精確地定位和檢索其中的元素HTML 結構,即使在處理特定的類別層次結構和內容要求時也是如此。

以上是如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板