Home > Article > Backend Development > XML operation of PHP extension (3) - XML parser usage and related functions
第一个例程缩进显示文档中的开始元素结构。
Example #1 显示 XML 元素结构
<?php$file = "data.xml";$depth = array(); function startElement($parser, $name, $attrs){ global $depth; for ($i = 0; $i < $depth[$parser]; $i++) { echo " "; } echo "$name\n"; $depth[$parser]++; } function endElement($parser, $name){ global $depth; $depth[$parser]--; } $xml_parser = xml_parser_create(); xml_set_element_handler($xml_parser, "startElement", "endElement"); if (!($fp = fopen($file, "r"))) {die("could not open XML input"); } while ($data = fread($fp, 4096)) { if (!xml_parse($xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d",xml_error_string(xml_get_error_code($xml_parser)), xml_get_current_line_number($xml_parser))); } }xml_parser_free($xml_parser); ?>
Example #1 将 XML 映射为 HTML
此例程直接地将 XML 标签映射为 HTML 标签。 在“map_array”中未找到的元素将被忽略。 当然,此例程只针对特定的 XML 文档类型起作用。
<?php$file = "data.xml"; $map_array = array("BOLD" => "B","EMPHASIS" => "I","LITERAL" => "TT"); function startElement($parser, $name, $attrs){ global $map_array; if (isset($map_array[$name])) { echo "<$map_array[$name]>"; } } function endElement($parser, $name){global $map_array; if (isset($map_array[$name])) { echo "</$map_array[$name]>";} } function characterData($parser, $data){ echo $data; } $xml_parser = xml_parser_create(); // use case-folding so we are sure to find the tag in $map_arrayxml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, true); xml_set_element_handler($xml_parser, "startElement", "endElement"); xml_set_character_data_handler($xml_parser, "characterData"); if (!($fp = fopen($file, "r"))) {die("could not open XML input"); } while ($data = fread($fp, 4096)) { if (!xml_parse($xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($xml_parser)), xml_get_current_line_number($xml_parser)));} } xml_parser_free($xml_parser); ?>
此例程用于加亮 XML 代码。举例说明如何使用外部实体引用来包含和解析其他文档, 及处理指令是如何被处理的,及判断处理指令所包含代码是否“可信任”的一种方法
用于此例程的 XML 文档位于此例程的下方( 和 )。
Example #1 外部实体例程
<?php$file = "xmltest.xml"; function trustedFile($file){ // 仅信任本地文件 if (!preg_match("@^([a-z]+)\:\/\/@i", $file)&& fileowner($file) == getmyuid()) {return true;}return false;} function startElement($parser, $name, $attribs){ echo "<<font color=\"#0000cc\">$name</font>"; if (count($attribs)) { foreach ($attribs as $k => $v) { echo " <font color=\"#009900\">$k</font>=\"<fontcolor=\"#990000\">$v</font>\"";}} echo ">"; } function endElement($parser, $name){ echo "</<font color=\"#0000cc\">$name</font>>"; } function characterData($parser, $data){ echo "<b>$data</b>"; } function PIHandler($parser, $target, $data){ switch (strtolower($target)) {case "php":global $parser_file; // 如何要解析的文档是“可信任”的, 则说明可安全// 地执行其内部的 PHP 代码。否则,显示代码内容。 if (trustedFile($parser_file[$parser])) { eval($data); } else {printf("Untrusted PHP code: <i>%s</i>",htmlspecialchars($data)); } break;}} function defaultHandler($parser, $data){ if (substr($data, 0, 1) == "&" && substr($data, -1, 1) == ";") { printf('<font color="#aa00aa">%s</font>',htmlspecialchars($data)); } else {printf('<font size="-1">%s</font>',htmlspecialchars($data));}} function externalEntityRefHandler($parser, $openEntityNames, $base, $systemId,$publicId) { if ($systemId) {if (!list($parser, $fp) = new_xml_parser($systemId)) {printf("Could not open entity %s at %s\n", $openEntityNames,$systemId); return false;}while ($data = fread($fp, 4096)) {if (!xml_parse($parser, $data, feof($fp))) { printf("XML error: %s at line %d while parsing entity %s\n",xml_error_string(xml_get_error_code($parser)),xml_get_current_line_number($parser), $openEntityNames);xml_parser_free($parser);return false;}}xml_parser_free($parser);return true;}return false;} function new_xml_parser($file){global $parser_file; $xml_parser = xml_parser_create();xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, 1); xml_set_element_handler($xml_parser, "startElement", "endElement"); xml_set_character_data_handler($xml_parser, "characterData"); xml_set_processing_instruction_handler($xml_parser, "PIHandler"); xml_set_default_handler($xml_parser, "defaultHandler"); xml_set_external_entity_ref_handler($xml_parser, "externalEntityRefHandler"); if (!($fp = @fopen($file, "r"))) {return false;} if (!is_array($parser_file)) {settype($parser_file, "array");}$parser_file[$xml_parser] = $file; return array($xml_parser, $fp);} if (!(list($xml_parser, $fp) = new_xml_parser($file))) {die("could not open XML input");} echo "<pre class="brush:php;toolbar:false">"; while ($data = fread($fp, 4096)) { if (!xml_parse($xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d\n", xml_error_string(xml_get_error_code($xml_parser)), xml_get_current_line_number($xml_parser)));}} echo "";echo "parse complete\n"; xml_parser_free($xml_parser); ?>
Example #2 xmltest.xml
025f411b6c80e9e39bd6b0129692fa04 0ee24980a98834caea670d4ad1f2d197 6930c6f1e77bb11139eaffe81fcc7033 ]> 8bfd02febb9b8b1ce76fb02e4f8fa74b 08eb756f81b28a01d33212cce3fbe742Title &plainEntity;0e94189e2178ffcfb346fb78b3f60691 5cdffc578c0c157aa49f9146402bc6dc eda1dae27a8d1fa57009d4d55aa88c3f c870fa3fa6f761c72e2376ed78df1372 92cee25da80fac49f6fb6eec5fd2c22a 2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a1c24f0f755fd404b426dca15a40629266542a628702c8e90b3ea600e9e3d5dd81b1c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c1c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e 2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a2c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c2c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e 2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a3c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325b3c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c3c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e ca745a59da05f784b8811374296574e1 adaedcdd287fe57618015106aeda16ea 6b0c63bbacd8835a656b6d5d011eafbd 8100103272b7d0e046d0adad5498ea61 &systemEntity; 498c4af2fa291b23083978cd5673e9b2 b2386ffb911b14667cb8f0f91ea547a7About this Document6e916e0f7d1e588d4f442bf645aedb2f 5cdffc578c0c157aa49f9146402bc6dc b440be2def2e0373bb3a224a0c239bee 5cab44c4c877f96530793145241d78a0 8100103272b7d0e046d0adad5498ea61 4d7ab0de9a42de71c682b0860bad1410 9e466180161ad6094e410bc58577745d
此文件包含在 中:
Example #3 xmltest2.xml
a2b87cb9bd1ae56f29bc02649eafc0b3 05b38f46ee6fba3f9299325c8c0797bf ]> 4f6c438d899b152724c4699117ad9ccf 042801de61348b00352ccc027d182aa6 &testEnt; 8d88354edae7ed9f6a5581d7870d6839 f82583eb14e508b4f2b959dd93fdb04e
utf8_decode — 将用 UTF-8 方式编码的 ISO-8859-1 字符串转换成单字节的 ISO-8859-1 字符串。
utf8_encode — 将 ISO-8859-1 编码的字符串转换为 UTF-8 编码
xml_error_string — 获取 XML 解析器的错误字符串
xml_get_current_byte_index — 获取 XML 解析器的当前字节索引
xml_get_current_column_number — 获取 XML 解析器的当前列号
xml_get_current_line_number — 获取 XML 解析器的当前行号
xml_get_error_code — 获取 XML 解析器错误代码
xml_parse_into_struct — 将 XML 数据解析到数组中
xml_parse — 开始解析一个 XML 文档
xml_parser_create_ns — 生成一个支持命名空间的 XML 解析器
xml_parser_create — 建立一个 XML 解析器
xml_parser_free — 释放指定的 XML 解析器
xml_parser_get_option — 从 XML 解析器获取选项设置信息
xml_parser_set_option — 为指定 XML 解析进行选项设置
xml_set_character_data_handler — 建立字符数据处理器
xml_set_default_handler — 建立默认处理器
xml_set_element_handler — 建立起始和终止元素处理器
xml_set_end_namespace_decl_handler — 建立终止命名空间声明处理器
xml_set_external_entity_ref_handler — 建立外部实体指向处理器
xml_set_notation_decl_handler — 建立注释声明处理器
xml_set_object — 在对象中使用 XML 解析器
xml_set_processing_instruction_handler — 建立处理指令(PI)处理器
xml_set_start_namespace_decl_handler — 建立起始命名空间声明处理器
xml_set_unparsed_entity_decl_handler — 建立未解析实体定义声明处理器
以上就是以上就是的内容,更多相关内容请关注PHP中文网(m.sbmmt.com)!的内容,更多相关内容请关注PHP中文网(m.sbmmt.com)!