PHP의 DOMDocument: HTML 문서 구문 분석 및 조작
HTML 문서 작업 시 DOM(Document Object Model)은 구조화되고 문서 내용의 객체 지향 표현. PHP의 DOMDocument 클래스를 사용하면 노드 수준에서 HTML 문서와 상호 작용하고 수정할 수 있습니다.
DOMDocument를 사용하여 HTML 문서를 구문 분석하려면 다음 단계를 따르세요.
- DOMDocument 객체를 생성하고 loadHTML()을 사용하여 HTML 콘텐츠를 로드합니다.
- DOMXPath를 사용하여 구문 분석된 내용을 쿼리하고 조작합니다. document.
귀하의 예에서는 모든
HTML 테이블에서 태그를 추출하고 해당 내용을 분석합니다. 그러나 제공한 코드는 결과에서 HTML 태그를 제거하는데 이는 바람직하지 않습니다.
HTML 태그를 보존하려면 DOMDocument가 다음과 같은 계층적 트리 구조로 전체 HTML 문서를 나타낸다는 점을 이해해야 합니다. 다양한 요소(예:
또는 태그)와 텍스트를 나타내는 노드.
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$trs = $xpath->query('//tr[@id="showContent"]');
foreach ($trs as $tr) {
echo $dom->saveXML($tr);
echo '<br>';
}
로그인 후 복사
이 코드는 saveXML()을 사용합니다. 각
의 실제 HTML 표현을 출력합니다. 태그, 태그와 해당 내용을 보존합니다. 해당
ID가 "showContent"인 div 내의 태그를 사용하면 문서의 특정 부분에 집중할 수 있습니다.
태그에 포함된 링크와 같은 태그가 있으면 추가 XPath 쿼리 또는 DOM 탐색 기술을 사용하여 필요한 특정 노드를 드릴다운할 수 있습니다.위 내용은 PHP의 DOMDocument는 어떻게 테이블에서 HTML 태그를 추출하고 보존할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.