在.NET Framework中簡單處理XML數(shù)據(jù)(1-2)
發(fā)表時間:2024-06-10 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]XmlReader類 XML閱讀器支持一個編程接口,接口用于連接XML文檔,“推出”你要的數(shù)據(jù)。如果你更深入去了解閱讀器,你會發(fā)現(xiàn)閱讀器工作原理類似于我們的桌面應(yīng)用程序從數(shù)據(jù)庫中取出數(shù)據(jù)的原理。數(shù)據(jù)庫服務(wù)返回一個游標對象,它包含所有查詢結(jié)果集,并返回指向目標數(shù)據(jù)集的開始地址的引用。XML閱讀...
XmlReader類 XML閱讀器支持一個編程接口,接口用于連接XML文檔,“推出”你要的數(shù)據(jù)。如果你更深入去了解閱讀器,你會發(fā)現(xiàn)閱讀器工作原理類似于我們的桌面應(yīng)用程序從數(shù)據(jù)庫中取出數(shù)據(jù)的原理。數(shù)據(jù)庫服務(wù)返回一個游標對象,它包含所有查詢結(jié)果集,并返回指向目標數(shù)據(jù)集的開始地址的引用。XML閱讀器的客戶端收到一個指向閱讀器實例的引用。該實例提取底層的數(shù)據(jù)流并把取出的數(shù)據(jù)呈現(xiàn)為一棵XML樹。閱讀器類提供只讀、向前的游標,你可以用閱讀器類提供的方法滾動游標遍歷結(jié)果集中的每一條數(shù)據(jù)。
從閱讀器中看XML文檔不是一個標簽文本文件,而是一個序列化的節(jié)點集合。它是.NET Framework中的一種特殊的游標模式;在.NET Framework中,你找不到其它的任何一個類似的API函數(shù)。
閱讀器和XMLDOM分析器有幾點不同的地方。XML閱讀器是只進的,它沒有父、子、祖宗、兄弟節(jié)點的概念,而且是只讀的。在.NET Framework中,讀寫XML文檔是分為兩種完全不同的功能,分別由XmlReader和XmlWriter類來完成。要編輯XML文檔,你可以用XMLDOM分析器,或者你自己設(shè)計一個類來實現(xiàn)這兩種功能。讓我們開始分析閱讀器的程序功能。
XmlReader是一個抽象類,你可以繼承并擴展它的功能。用戶程序一般都基于下面的三種類:XmlTextReader、XmlValidatingReader或者 XmlNodeReader類。所有的這些類都有如圖一的屬性和圖二的方法。要注意的是,某些屬性的值實際上依賴于實際的某個閱讀器類,不同的類與基類可能不同。因此,在圖一中每個屬性的說明都是以基類為準的。例如,CanResolveEntity屬性在XmlValidatingReader類中只返回true;而在其它的閱讀器類中它卻可以設(shè)為false。同樣的,在圖二中的某些方法的實際返回值對不同的類可能不同。例如,如果節(jié)點類型不是元素節(jié)點(element node),所有包含Atrributes的方法的返回值類型都是void。
XmlTextReader類用只進,只讀的方式快速訪問XML數(shù)據(jù)流。閱讀器先驗證XML文檔是否是格式良好的,如果不是則拋出一個異常。XmlTextReader 檢查 DTD 的格式是否良好,但不使用 DTD 對文檔進行驗證。XmlTextReader通過XML文檔的文件名,或它的URL,或者從文件流中載入XML文檔,然后快速的處理XML文檔數(shù)據(jù)。如果你需要對文檔的數(shù)據(jù)進行驗證,你可以用XmlValidatingReader類。
可以用多種方法創(chuàng)建XmlTextReader類的實例,從硬盤中加載文件,或從URL地址中加載,流(streams)中加載,還有就是從文本中讀入XML文檔數(shù)據(jù):
XmlTextReader reader = new XmlTextReader(file);
注意,所有XmlTextReader類的公共(public)構(gòu)造函數(shù)都要求你指定數(shù)據(jù)源,數(shù)據(jù)源可以是stream、文件或者其它。XmlTextReader默認的構(gòu)造函數(shù)是受保護的(protected),所以不能直接使用。像.NET Framework中所有的閱讀器類一樣(如SqlDataReader類),一旦閱讀器對象連接并打開,你就可以用Read方法去訪問數(shù)據(jù)了。開始的時候只能用Read方法把指針移到第一個元素;然后我們可以用Read方法或其它方法(如Skip, MoveToContent和ReadInnerXml)移動指針到下一個節(jié)點元素。要處理整個XML文檔的內(nèi)容,可以根據(jù)Read方法的返回值用一個循環(huán)遍歷文檔內(nèi)容,因為Read方法返回一個布爾值,當讀到文檔的尾節(jié)點時,Read方法返回false,否則它返回true。
Figure 3 Outputting an XML Document Node Layout
string GetXmlFileNodeLayout(string file)
{
// 創(chuàng)建一個XmlTextReader類使它指向目標XML文檔
XmlTextReader reader = new XmlTextReader(file);
// 循環(huán)取出節(jié)點的文本并放入到StringWriter對象實例中
StringWriter writer = new StringWriter();
string tabPrefix = "";
while (reader.Read())
{
// 寫開始標志,如果節(jié)點類型為元素
if (reader.NodeType == XmlNodeType.Element)
{
//根據(jù)元素所處節(jié)點的深度,加入reader.Depth個tab符,然后把元素名寫入到<>中。
tabPrefix = new string('\t', reader.Depth);
writer.WriteLine("{0}<{1}>", tabPrefix, reader.Name);
}
else
{
//寫結(jié)束標志,如果節(jié)點類型為元素
if (reader.NodeType == XmlNodeType.EndElement)
{
tabPrefix = new string('\t', reader.Depth);
writer.WriteLine("{0}", tabPrefix, reader.Name);
}
}
}
// 輸出到屏幕
string buf = writer.ToString();
writer.Close();
// 關(guān)閉流
reader.Close();
return buf;
}
圖三演示了一個簡單的用于輸出一個給定的XML文檔的節(jié)點元素的函數(shù)。該函數(shù)先打開一個XML文檔,然后用循環(huán)處理XML文檔中所有的內(nèi)容。每次調(diào)用Read方法,閱讀器的指針都會向下移一個節(jié)點。大部分情況下,用Read方法可以處理的元素節(jié)點,但有時候,當你從一個節(jié)點移動到下一個節(jié)點時,可能是在兩個不同類型的節(jié)點間移動。但是Read方法不能在屬性節(jié)點之間移動。閱讀器的MoveToContent方法可以讓指針從頭部節(jié)點位置跳到第一個內(nèi)容節(jié)點位置。在ProcessingInstruction, DocumentType, Comment, Whitespace和SignificantWhitespace類型節(jié)點中也可以用Skip方法移動指針。