PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?-PHP 튜토리얼-php.cn

PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

Linda Hamilton

풀어 주다： 2024-12-08 03:44:09

원래의

809명이 탐색했습니다.

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument?

DOMDocument를 사용한 HTML 노드 추출 문제

소개

PHP 클래스인 DOMDocument는 구문 분석을 위한 편리한 접근 방식을 제공합니다. 그리고 HTML 문서를 조작합니다. 그러나 콘텐츠를 추출하는 동안 HTML 태그를 유지하려고 하면 사용자가 어려움을 겪을 수 있습니다. 이 기사에서는 DOM의 기본 개념을 자세히 살펴보고 이 과제를 해결하기 위한 솔루션을 제안합니다.

DOM 및 노드 이해

DOMDocument는 HTML 문서를 노드의 계층적 트리로 나타냅니다. 각 노드에는 하위 노드가 있어 복잡한 구조를 형성할 수 있습니다. 속성 및 텍스트 콘텐츠와 함께 HTML 요소가 모두 DOMDocument 내에서 노드로 표시된다는 점을 인식하는 것이 중요합니다.

태그 보존 문제 해결

제공된 코드는 "showContent" ID를 사용하여 DIV 노드를 성공적으로 가져옵니다. 그러나 HTML 태그 자체를 제외하고 DIV 내의 텍스트 콘텐츠만 검색합니다. 이는 코드가 실제 노드가 아닌 텍스트만 추출하는 $tag->nodeValue를 사용하기 때문입니다.

해결책: 노드 순회

HTML 노드를 보존하려면 대상 노드의 하위 노드를 순회해야 합니다. 아래 코드는 이 접근 방식을 보여줍니다.

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('.//div[@id="showContent"]');
foreach ($tags as $tag) {
    echo $dom->saveXML($tag);
    echo '<br>';
}

로그인 후 복사

HTML에서 특정 정보 검색

테이블의 링크와 같이 HTML 문서에서 특정 정보가 필요한 경우 XPath 쿼리를 수정하여 적절한 노드를 선택할 수 있습니다. 예:

foreach ($div->getElementsByTagName('a') as $link) {
    echo $dom->saveXML($link);
}

로그인 후 복사

추가 리소스

DOMDocument 작업에 대한 추가 지원은 다음 리소스를 참조하세요.

[ DOM문서 문서](https://www.php.net/manual/en/class.domdocument.php)
[스택 오버플로의 DOMDocument에 대한 질문과 답변](https://stackoverflow.com/search? q=사용자:208809 DOM)

위 내용은 PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!