明輝手游網(wǎng)中心:是一個(gè)免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺(tái)!

PHP中的XML應(yīng)用(一)

[摘要]綜述 XML代表Extensible Markup Language(eXtensible Markup Language的縮寫,意為可擴(kuò)展的標(biāo)記語言)。XML是一套定義語義標(biāo)記的規(guī)則,這些標(biāo)記將文檔分成許多部件并對(duì)這些部件加以標(biāo)識(shí)。它也是元標(biāo)記語言,即定義了用于定義其他與特定領(lǐng)域有關(guān)的、語義...
綜述
XML代表Extensible Markup Language(eXtensible Markup Language的縮寫,意為可擴(kuò)展的標(biāo)記語言)。XML是一套定義語義標(biāo)記的規(guī)則,這些標(biāo)記將文檔分成許多部件并對(duì)這些部件加以標(biāo)識(shí)。它也是元標(biāo)記語言,即定義了用于定義其他與特定領(lǐng)域有關(guān)的、語義的、結(jié)構(gòu)化的標(biāo)記語言的句法語言。XML是當(dāng)今最熱門的技術(shù)。而PHP也具有分析XML文檔的功能,下面我們將共同探討一下PHP中的XML應(yīng)用的情況。

XML概貌
  談起XML(eXtended Markup Language:可擴(kuò)展標(biāo)記語言),我們不妨先看一段HTML的代碼:

<html>
<title>XML</title>
<body>
<p><center><font color="red">TEXT</font></center></p>
<a href="www.domain.com"><img src=http://cfan.net.cn/info/"logo.jpg"/></a>
</body>
</html>

  上面這段代碼從結(jié)構(gòu)上就符合XML的規(guī)則,XML可以理解是包含數(shù)據(jù)的樹形的結(jié)構(gòu)類型:

1、引用同一個(gè)元素的時(shí)候,使用一致的大小寫,如<center></Center>就是不符合規(guī)定的
2、任何屬性值(如 href="????")要用""引起來,如<a href=www.yahoo.com>就是不正確的
3、所有元素必須由打開<和關(guān)閉>標(biāo)注組成,元素應(yīng)該形如<body></body>或空元素<img ... />,如果結(jié)尾的 "/>" 少了"/"就是錯(cuò)誤的代碼
4、所有元素必須彼此嵌套,就像寫程序的循環(huán)一樣,而且,所有的元素必須嵌套于根元素之中,比如上面的代碼所有的內(nèi)容都嵌套于<html></html>之中。
5、元素名稱(即上面的body a p img等)應(yīng)為字母開頭。

怎樣應(yīng)用PHP的XML解析器Expat?
Expat是PHP腳本語言的XML解析器(同樣稱為XML處理器),可以使程序訪問XML文檔的結(jié)構(gòu)和內(nèi)容。它是一種基于事件的解析器。XML解析器有兩種基本類型:

基于樹型的解析器:將XML文檔轉(zhuǎn)換成樹型結(jié)構(gòu)。這類解析器分析整篇文章,同時(shí)提供一個(gè)API來訪問所產(chǎn)生樹的每個(gè)元素。其通用的標(biāo)準(zhǔn)為DOM(文檔對(duì)象模式)。

基于事件的解析器:將XML文檔視為一系列的事件。當(dāng)一個(gè)特殊事件發(fā)生時(shí),解析器將調(diào)用開發(fā)者提供的函數(shù)來處理;谑录慕馕銎饔幸粋(gè)XML文檔的數(shù)據(jù)集中視圖,也就是說它集中在XML文檔的數(shù)據(jù)部分,而不是其結(jié)構(gòu)。這些解析器從頭到尾處理文檔,并將類似于-元素的開始、元素的結(jié)尾、特征數(shù)據(jù)的開始等等-事件通過回調(diào)(callback)函數(shù)報(bào)告給應(yīng)用程序。

以下是一個(gè)"Hello-World"的XML文檔范例:

<greeting>
Hello World
</greeting>

  基于事件的解析器將報(bào)告為三個(gè)事件:

開始元素:greeting
CDATA項(xiàng)的開始,值為:Hello World
結(jié)束元素:greeting

  基于事件的解析器不產(chǎn)生描述文檔的結(jié)構(gòu),當(dāng)然如果使用Expat,必要時(shí)它一樣可以在PHP中生成完全的原生樹結(jié)構(gòu)。在CDATA項(xiàng)中,基于事件的解析器不會(huì)得到父元素greeting的信息。然而,它提供一個(gè)更底層的訪問,這就使得可以更好地利用資源和更快地訪問。通過這種方式,就沒有必要將整個(gè)文檔放入內(nèi)存;而事實(shí)上,整個(gè)文檔甚至可以大于實(shí)際內(nèi)存值。

  上面Hello-World的范例雖然包括完整的XML格式,但它是無效的,因?yàn)榧葲]有DTD(文檔類型定義)與其聯(lián)系,也沒有內(nèi)嵌DTD。但是Expat是一個(gè)不檢查有效性的解析器,因此忽略任何與文檔聯(lián)系的DTD。應(yīng)注意的是文檔仍然需要完整的格式,否則Expat(和其他符合XML標(biāo)準(zhǔn)的解析器一樣)將會(huì)隨著出錯(cuò)信息而停止。

編譯Expat
  Expat可以編譯進(jìn)PHP3.0.6版本(或以上)中。從Apache1.3.22開始,Expat已經(jīng)作為Apache的一部分。在Unix系統(tǒng)中,可以通過-with-xml選項(xiàng)配置PHP將其編譯入PHP。

  如果將PHP編譯為Apache的模塊,而Expat將默認(rèn)作為Apache的一部分。在Windows中,則必須要加載XML動(dòng)態(tài)連接庫(kù)。

  XML范例:XMLstats
  我們所要討論的范例是使用Expat來收集XML文檔的統(tǒng)計(jì)數(shù)據(jù)。

  對(duì)于文檔中每個(gè)元素,以下信息都將被輸出:

該元素在文檔中使用的次數(shù)
該元素中字符數(shù)據(jù)的數(shù)量
元素的父元素
元素的子元素

  注意:為了演示,我們利用PHP來產(chǎn)生一個(gè)結(jié)構(gòu)來保存元素的父元素和子元素.

用于產(chǎn)生XML解析器實(shí)例的函數(shù)有哪些?
  用于產(chǎn)生XML解析器實(shí)例的函數(shù)為xml_parser_create()。該實(shí)例將用于以后的所有函數(shù)。這個(gè)思路非常類似于PHP中MySQL函數(shù)的連接標(biāo)記。在解析文檔前,基于事件的解析器通常要求注冊(cè)回調(diào)函數(shù)-用于特定的事件發(fā)生時(shí)調(diào)用。Expat沒有例外事件,它定義了如下七個(gè)可能事件:

對(duì)象 XML解析函數(shù) 描述
元素 xml_set_element_handler() 元素的開始和結(jié)束
字符數(shù)據(jù) xml_set_character_data_handler() 字符數(shù)據(jù)的開始
外部實(shí)體 xml_set_external_entity_ref_handler() 外部實(shí)體出現(xiàn)
未解析外部實(shí)體 xml_set_unparsed_entity_decl_handler() 未解析的外部實(shí)體出現(xiàn)
處理指令 xml_set_processing_instruction_handler() 處理指令的出現(xiàn)
記法聲明 xml_set_notation_decl_handler() 記法聲明的出現(xiàn)
默認(rèn) xml_set_default_handler() 其它沒有指定處理函數(shù)的事件

所有的回調(diào)函數(shù)必須將解析器的實(shí)例作為其第一個(gè)參數(shù)(此外還有其它參數(shù))。

  對(duì)于本文最后的范例腳本,需要注意的是它既用到了元素處理函數(shù)又用到了字符數(shù)據(jù)處理函數(shù)。元素的回調(diào)處理函數(shù)通過xml_set_element_handler()來注冊(cè)。

這個(gè)函數(shù)需要三個(gè)參數(shù):

解析器的實(shí)例
處理開始元素的回調(diào)函數(shù)的名稱
處理結(jié)束元素的回調(diào)函數(shù)的名稱
  當(dāng)開始解析XML文檔時(shí),回調(diào)函數(shù)必須存在。它們必須定義為與PHP手冊(cè)中所描述的原型一致。

  例如,Expat將三個(gè)參數(shù)傳遞給開始元素的處理函數(shù)。在腳本范例中,其定義如下:

function start_element($parser, $name, $attrs)

$parser是解析器標(biāo)志,$name是開始元素的名稱,$attrs為包含元素所有屬性和值的數(shù)組。

一旦開始解析XML文檔,Expat在遇到開始元素是都將調(diào)用start_element()函數(shù)并將參數(shù)傳遞過去。

  XML的Case Folding選項(xiàng)
  用xml_parser_set_option()函數(shù)將Case folding選項(xiàng)關(guān)閉。這個(gè)選項(xiàng)默認(rèn)是打開的,使得傳遞給處理函數(shù)的元素名自動(dòng)轉(zhuǎn)換為大寫。但XML對(duì)大小寫是敏感的(所以大小寫對(duì)統(tǒng)計(jì)XML文檔是非常重要的)。對(duì)于我們的范例,case folding選項(xiàng)必須關(guān)閉。

<待續(xù)>




相關(guān)文章