PHP XML Expat 解析器

PHP XML Expat 解析器

內建的 Expat 解析器使在 PHP 中處理 XML 文件成為可能。

XML 是什麼?

XML即可擴充標記語言(eXtensible Markup Language)。標記是指電腦所能理解的資訊符號,透過此種標記,電腦之間可以處理包含各種資訊的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,例如HTML,也可以使用象XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。 XML是從SGML簡化修改出來的。它主要用到的有XML、XSL和XPath等。

上面這段是XML的一個基本定義,一個被廣泛接受的說明。簡單說,XML就是一種資料的描述語言,雖然它是語言,但通常情況下,它並不具備常見語言的基本功能──被電腦辨識並運作。只有依靠另一種語言,來解釋它,使它達到你想要的效果或被電腦所接受。

假如你是剛接觸XML的新手,那麼可能無法從定義上是了解XML是什麼。也許,你可以換個角度來認識XML是什麼;從應用面來認識XML,從XML可以做些什麼來認識它,這應該能比那更空洞的定義對你更有幫助。

XML應用程式主要分為兩種類型,文件型和資料型。以下介紹幾個常見的XML應用程式:

1、自訂XML+XSLT=>HTML,最常見的文件型應用程式之一。 XML存放整個文件的XML數據,然後XSLT將XML轉換、解析,結合XSLT中的HTML標籤,最終成為HTML,顯示在瀏覽器上。典型的例子就是CSDN上的貼文。

2、XML作為微型資料庫,這是最常見的資料型應用之一。我們利用相關的XML API(MSXML DOM、JAVA DOM等)對XML進行存取和查詢。留言板的實作中,就常常可以看到用XML作為資料庫。

3、作為通訊資料。最典型的就是WEB SERVICE,利用XML來傳遞資料。

4、作為一些應用程式的設定資訊資料。常見的如J2EE配置WEB伺服器時所用的web.XML。

5、其他一些文件的XML格式。如WORD、EXCEL等。

6、儲存資料間的映射關係。如Hibernate。

這裡介紹的6種應用,基本上涵蓋了XML的主要用途。總之,XML是一種抽象的語言,它不如傳統的程式語言那麼具體。要深入的認識它,應該先從它的應用入手,選擇一種你需要的用途,然後再學習如何使用。

XML 用於描述數據,其焦點是數據是什麼。 XML 檔案描述了資料的結構。

在 XML 中,沒有預先定義的標籤。您必須定義自己的標籤。

如需學習更多關於 XML 的知識,請造訪我們的 XML 教學。

Expat 是什麼?

Expat是一個串流導向的解析器。您註冊的解析器回呼(或handler)功能,然後開始搜尋它的文件。當解析器識別該檔案的指定的位置,它會呼叫該部分對應的處理程序(如果您已經註冊的一個)。該檔案被傳送到解析器,會分割成多個片斷,並分段裝到記憶體中。因此expat可以解析那些龐大的文件。

 

如需讀取和更新 - 建立和處理 - 一個 XML 文檔,您需要 XML 解析器。

有兩種基本的 XML 解析器類型:

·         以樹為基礎的解析器:此解析器將 XML 文件轉換為樹型結構。它分析整篇文檔,並提供了對樹中元素的訪問,例如文檔物件模型 (DOM)。

·         以事件為基礎的解析器:將 XML 文件視為一連串的事件。當某個特定的事件發生時,解析器會呼叫函數來處理。

Expat 解析器是基於事件的解析器。

基於事件的解析器集中在 XML 文件的內容,而不是它們的結構。正因為如此,基於事件的解析器能夠比基於樹的解析器更快存取資料。

請看下面的XML 片段:

<from>Jani</from>

基於事件的解析器把上面的XML 報告為一連串的三個事件:

·         開始元素:from

·         開始CDATA 部分,值:Jani

·  良好的XML。不過這個實例是無效的 XML,因為沒有與它關聯的文件類型聲明 (DTD)。

然而,在使用 Expat 解析器時,這沒有區別。 Expat 是不檢查有效性的解析器,忽略任何 DTD。

作為一款基於事件、非驗證的 XML 解析器,Expat 快速且輕巧,十分適合 PHP 的 Web 應用程式。

註解:XML 文件必須形式良好,否則 Expat 會產生錯誤。

安裝

XML Expat 解析器函數是 PHP 核心的組成部分。無需安裝就可以使用這些函數。

XML 檔案

下面的XML 檔案將會套用在我們的實例中:

<?xml version="1.0" encoding=" ISO-8859-1"?>

<note>

<to>Tove</to>
<from>Jani</from>
<heading>Reminder</ heading>
<body>Don't forget me this weekend!</body>
</note>

初始化XML 解析器;/note>

初始化XML 解析器

我們要在PHP 中初始化XML 解析器,為不同的XML 事件定義處理器,然後解析這個XML 檔案。

實例###
<?php
 //Initialize the XML parser
 $parser=xml_parser_create();
 
 //Function to use at the start of an element
 function start($parser,$element_name,$element_attrs)
 {
 switch($element_name)
 {
 case "NOTE":
 echo "-- Note --<br>";
 break;
 case "TO":
 echo "To: ";
 break;
 case "FROM":
 echo "From: ";
 break;
 case "HEADING":
 echo "Heading: ";
 break;
 case "BODY":
 echo "Message: ";
 }
 }
 
 //Function to use at the end of an element
 function stop($parser,$element_name)
 {
 echo "<br>";
 }
 
 //Function to use when finding character data
 function char($parser,$data)
 {
 echo $data;
 }
 
 //Specify element handler
 xml_set_element_handler($parser,"start","stop");
 
 //Specify data handler
 xml_set_character_data_handler($parser,"char");
 
 //Open XML file
 $fp=fopen("test.xml","r");
 
 //Read data
 while ($data=fread($fp,4096))
 {
 xml_parse($parser,$data,feof($fp)) or 
 die (sprintf("XML Error: %s at line %d", 
 xml_error_string(xml_get_error_code($parser)),
 xml_get_current_line_number($parser)));
 }
 
 //Free the XML parser
 xml_parser_free($parser);
 ?>
###以上程式碼將輸出:###

-- Note --
To: Tove
From: Jani
Heading: Reminder
Message: Don't forget me this weekend!

工作原理:

1.     透過xml_parser_create() 函數初始化XML 解析器

2.     建立配合不同事件處理程序的的函數

3.     新增xml_set_element_handler() 定義,當解析器遇到開始和結束標籤時執行哪個函數

4.     在新增xml_set_character_data_handler() 函數來定義,當解析器遇到字元資料時執行哪個函數

5.     透過xml_parse()函數來解析檔案"test.xml"

6.     萬一有錯誤的話,加上xml_error_string() 函數把XML 錯誤轉換成文字說明

7.     呼叫xml_parser_free() 函數來釋放分配給xml_parser_create() 函數的內存

更多PHP Expat 解析器的信息

如需了解更多關於PHP Expat 函數的信息,請訪問我們的PHP XML Parser 參考手冊。


繼續學習
||
<?php //Initialize the XML parser $parser=xml_parser_create(); //Function to use at the start of an element function start($parser,$element_name,$element_attrs) { switch($element_name) { case "NOTE": echo "-- Note --<br>"; break; case "TO": echo "To: "; break; case "FROM": echo "From: "; break; case "HEADING": echo "Heading: "; break; case "BODY": echo "Message: "; } } //Function to use at the end of an element function stop($parser,$element_name) { echo "<br>"; } //Function to use when finding character data function char($parser,$data) { echo $data; } //Specify element handler xml_set_element_handler($parser,"start","stop"); //Specify data handler xml_set_character_data_handler($parser,"char"); //Open XML file $fp=fopen("test.xml","r"); //Read data while ($data=fread($fp,4096)) { xml_parse($parser,$data,feof($fp)) or die (sprintf("XML Error: %s at line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser))); } //Free the XML parser xml_parser_free($parser); ?>