在 PHP 中使用 DOMDocument 解析 HTML5
PHP 的 DOMDocument 难以解析 HTML5 文档,引发诸如
DOMDocument 限制:
不幸的是,DOMDocument 缺乏对解析现代 HTML5 标签的支持。它遵循严格的 XML 规范,无法识别这些标签。
禁用错误报告:
虽然无法强制 DOMDocument 解析 HTML5,但您可以抑制错误它生成的消息。利用 libxml_use_internal_errors 暂时禁用错误报告:
<code class="php">$dom = new DOMDocument; libxml_use_internal_errors(true); $dom->loadHTML('...'); libxml_clear_errors();</code>
这种方法允许您解析 HTML5 而不会遇到错误。然而,需要注意的是,它并没有真正启用 HTML5 解析。它只是掩盖由于无法识别的标签而生成的错误。
替代方法:
对于真正的 HTML5 解析,请考虑探索其他解析库,例如:
这些库专门处理 HTML5 语法,允许您修改 HTML5 代码中的属性和值。
以上是如何在 PHP 中使用 DOMDocument 解析 HTML5 文档?的详细内容。更多信息请关注PHP中文网其他相关文章!