用JDOM處理XML文檔
發(fā)表時(shí)間:2024-02-13 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]用JDOM處理XML文檔關(guān)鍵詞:Java、JDOM、XML、JAXB歡迎與我討論(boyofjava@sina.com)(一)JDOM的介紹以及與JAXB的比較Java + XML = JDOM !這就是JDOM設(shè)計(jì)者的目標(biāo)。如果你曾經(jīng)使用過煩人的SAX或是DOM來處理XML,你就會(huì)知道為什么要有...
用JDOM處理XML文檔
關(guān)鍵詞:Java、JDOM、XML、JAXB
歡迎與我討論(boyofjava@sina.com)
(一)JDOM的介紹以及與JAXB的比較
Java + XML = JDOM !
這就是JDOM設(shè)計(jì)者的目標(biāo)。如果你曾經(jīng)使用過煩人的SAX或是DOM來處理XML,你就會(huì)知道為什么要有JDOM或者是JAXB。在今年(2002)的JavaOne會(huì)議上JDOM的主要?jiǎng)?chuàng)始人Jason Hunter有一篇精彩的演講介紹了JDOM技術(shù),題目就是JDOM Makes XML Easy。
在那篇文檔里,JDOM被拿來與DOM比較,而我更愿意拿它同JAXB比較。因?yàn)镴AXB和JDOM都是為了在Java中提供比DOM和SAX更為方便的XML處理接口而開發(fā)的,并且通過完全不同的途徑來解決這個(gè)問題。JDOM的處理方式是與DOM類似的樹操作。而JAXB通過DTD和綁定模式來生成訪問XML文檔的Java代碼,將XML映射成了Java對(duì)象來操作。你可以根據(jù)項(xiàng)目的需要和個(gè)人喜好來決定采用哪一個(gè)。
JDOM與JAXB的比較,從本身的特點(diǎn)來看:
1) JDOM比JAXB更容易上手。使用JAXB首先要會(huì)編寫DTD,然后還要會(huì)編寫綁定模式。JDOM沒有這樣的要求,如果你會(huì)Java和XML,甚至可以說光是看JDOM的javadoc文檔就能夠使用JDOM。
2) JAXB編寫好DTD和綁定模式以后,XML文檔被映射成了Java對(duì)象,其數(shù)據(jù)就是Java對(duì)象的屬性,連數(shù)據(jù)類型都做好了轉(zhuǎn)換,因此,訪問XML文檔比JDOM要簡便,可以說是一勞永逸。
3) JAXB由某個(gè)DTD和綁定模式生成的代碼只能訪問該DTD所約束的文檔。如果想要訪問其他XML文檔,需要再編寫DTD和綁定模式。JDOM可以處理任何XML文檔,包括受約束的和不受約束的。
目前JDOM和JAXB都沒有正式版本。JDOM的最新版本是beta8,JAXB是1.0 early access,其規(guī)范版本是0.21。相對(duì)而言,JDOM更成熟一些。例如JAXB不支持名字空間、不能向XML文檔寫入處理指令,有時(shí)我們需要保留的換行符和首尾空格在JAXB中自動(dòng)過濾掉了,就連放在<![CDATA[ 和 ]]>里面也不能幸免。JDOM就沒有這些限制。如果說以上的3點(diǎn)比較是JDOM和JAXB本身的特點(diǎn)所決定的,幾乎不可能改變,那么這里表明,JAXB還需要更多的工作。
(二)獲得并安裝JDOM
在http://jdom.org可以下載JDOM的最新版本。以JDOM beta8的2進(jìn)制版本為例。下載后解壓縮,JDOM的jar文件就是build目錄下的文件jdom.jar,將之加入類路徑。另外JDOM還需要lib目錄下那些jar文件如xerces.jar的支持。如果在使用中出現(xiàn)以下錯(cuò)誤:
java.lang.NoSuchMethodError
或
java.lang.NoClassDefFoundError: org/xml/sax/SAXNotRecognizedException
你需要保證xerces.jar文件在CLASSPATH中位于其他XML類,如JAXP或Crimson之前,這些類文件,包括以前老版本的xerces,可能不支持SAX2.0或DOM Level 2。于是導(dǎo)致了上面的錯(cuò)誤。
(三)一個(gè)簡單的例子
JDOM的處理方式有些類似于DOM,但它主要是用SAX實(shí)現(xiàn)的,你不必?fù)?dān)心處理速度和內(nèi)存的問題。另外,JDOM中幾乎沒有接口,的類全部是實(shí)實(shí)在在的類,沒有類工廠類的。其最重要的一個(gè)包org.jdom中主要有以下類:
? Attribute
? CDATA
? Comment
? DocType
? Document
? Element
? EntityRef
? Namespace
? ProcessingInstruction
? Text
數(shù)據(jù)輸入要用到XML文檔要通過org.jdom.input包,反過來需要org.jdom.output。如前面所說,關(guān)是看API文檔就能夠使用。
我們的例子讀入XML文件exampleA.xml,加入一條處理指令,修改第一本書的價(jià)格和作者,并添加一條屬性,然后寫入文件exampleB.xml:
//exampleA.xml
<?xml version="1.0" encoding="GBK"?>
<bookList>
<book>
<name>Java編程入門</name>
<author>張三</author>
<publishDate>2002-6-6</publishDate>
<price>35.0</price>
</book>
<book>
<name>XML在Java中的應(yīng)用</name>
<author>李四</author>
<publishDate>2002-9-16</publishDate>
<price>92.0</price>
</book>
</bookList>
//testJDOM.java
import org.jdom.*;
import org.jdom.output.*;
import org.jdom.input.*;
import java.io.*;
public class TestJDOM{
public static void main(String args[])throws Exception{
SAXBuilder sb = new SAXBuilder();
//從文件構(gòu)造一個(gè)Document,因?yàn)閄ML文件中已經(jīng)指定了編碼,所以這里不必了
Document doc = sb.build(new FileInputStream("exampleA.xml"));
//加入一條處理指令\
ProcessingInstruction pi = new ProcessingInstruction
("xml-stylesheet","href=\"bookList.html.xsl\" type=\"text/xsl\"");
doc.addContent(pi);
Element root = doc.getRootElement(); //得到根元素
java.util.List books = root.getChildren(); //得到根元素所有子元素的集合
Element book = (Element)books.get(0); //得到第一個(gè)book元素
//為第一本書添加一條屬性
Attribute a = new Attribute("hot","true");
book.setAttribute(a);
Element author = book.getChild("author"); //得到指定的字元素
author.setText("王五\\"); //將作者改為王五\r
//或 Text t = new Text("王五\\");book.addContent(t);
Element price = book.getChild("price"); //得到指定的字元素
//修改價(jià)格,比較郁悶的是我們必須自己轉(zhuǎn)換數(shù)據(jù)類型,而這正是JAXB的優(yōu)勢
author.setText(Float.toString(50.0f));
String indent = " ";
boolean newLines = true;
XMLOutputter outp = new XMLOutputter(indent,newLines,"GBK");
outp.output(doc, new FileOutputStream("exampleB.xml"));
}
};
執(zhí)行結(jié)果exampleB.xml:
<?xml version="1.0" encoding="GBK"?>
<bookList>
<book hot=”true”>
<name>Java編程入門</name>
<author>50.0</author>
<publishDate>2002-6-6</publishDate>
<price>35.0</price>
</book>
<book>
<name>XML在Java中的應(yīng)用</name>
<author>李四</author>
<publishDate>2002-9-16</publishDate>
<price>92.0</price>
</book>
</bookList>
<?xml-stylesheet href="bookList.html.xsl" type="text/xsl"?>
在默認(rèn)情況下,JDOM的Element類的getText()這類的方法不會(huì)過濾空白字符,如果你需要過濾,用setTextTrim() 。
(四)參考文檔
1) JDOM Makes XML Easy (http://www.servlets.com/speaking/jdom-javaone.pdf)
2) The Java ™ Architecture for XML Binding User’s Guide (http://java.sun.com/xml/jaxb/jaxb-docs.pdf)
3) Web Services Made Easier. The Java TM APIs and Architectures for XML, A Technical White Paper (http://java.sun.com/xml/webservices.pdf )