這是用Java進行XML解析的最佳庫。
實際上,Java支持4種開箱即用地解析XML的方法:
DOM解析器/構建器:整個XML結構都已加載到內存中,你可以使用眾所周知的DOM方法進行處理。DOM還允許你使用Xslt轉換來寫文檔。例:
public static void parse() throws ParserConfigurationException, IOException, SAXException { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setValidating(true); factory.setIgnoringElementContentWhitespace(true); DocumentBuilder builder = factory.newDocumentBuilder(); File file = new File('test.xml'); Document doc = builder.parse(file); // Do something with the document here.}
SAX Parser:僅讀取XML文檔。Sax解析器貫穿文檔并調用用戶的回調方法。存在用于文檔的開始/結束,元素等的方法。它們是在org.xml.sax.ContentHandler中定義的,并且有一個空的幫助程序類DefaultHandler。
public static void parse() throws ParserConfigurationException, SAXException { SAXParserFactory factory = SAXParserFactory.newInstance(); factory.setValidating(true); SAXParser saxParser = factory.newSAXParser(); File file = new File('test.xml'); saxParser.parse(file, new ElementHandler()); // specify handler}
StAx讀取器/寫入器:與面向數據流的接口一起使用。程序會在準備好時要求下一個元素,就像游標/迭代器一樣。你也可以使用它創建文檔。閱讀文件:
public static void parse() throws XMLStreamException, IOException { try (FileInputStream fis = new FileInputStream('test.xml')) {XMLInputFactory xmlInFact = XMLInputFactory.newInstance();XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);while(reader.hasNext()) { reader.next(); // do something here} }}
撰寫文件:
public static void parse() throws XMLStreamException, IOException { try (FileOutputStream fos = new FileOutputStream('test.xml')){XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);writer.writeStartDocument();writer.writeStartElement('test');// write stuffwriter.writeEndElement(); }}
JAXB:讀取XML文檔的最新實現:是v2中Java 6的一部分。這使我們可以序列化文檔中的Java對象。你使用一個實現了javax.xml.bind.Unmarshaller的接口的類來閱讀文檔(你可以從JAXBContext.newInstance中獲得一個用于該類的類)。必須使用使用的類來初始化上下文,但是你只需要指定根類,而不必擔心靜態引用的類。你可以使用注釋來指定哪些類應該是元素(@XmlRootElement),哪些字段應該是元素(@XmlElement)或屬性(@XmlAttribute,這真是個驚喜!)
public static void parse() throws JAXBException, IOException { try (FileInputStream adrFile = new FileInputStream('test')) {JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);Unmarshaller um = ctx.createUnmarshaller();RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile); }}
撰寫文件:
public static void parse(RootElementClass out) throws IOException, JAXBException { try (FileOutputStream adrFile = new FileOutputStream('test.xml')) {JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);Marshaller ma = ctx.createMarshaller();ma.marshal(out, adrFile); }}
從一些舊的演講幻燈片中無恥地復制了示例;-)
編輯:關于“我應該使用哪個API?”。好吧,這取決于-并非所有API都具有與你看到的功能相同的功能,但是如果你可以控制用于映射XML文檔的類,那么JAXB是我個人最喜歡的,非常優雅和簡單的解決方案(盡管我沒有將其用于非常大的文檔,可能會有點復雜)。SAX也非常易于使用,如果你沒有充分的理由使用它,那就不要使用DOM-我認為舊的,笨拙的API。我認為沒有任何現代的第三方庫具有STL所缺少的任何特別有用的功能,并且標準庫具有通常的優點,即它們經過了嚴格的測試,記錄和穩定。
解決方法我正在搜索Java庫以解析XML(復雜的配置和數據文件),我用Google搜索了一下,但除了dom4j之外都找不到(似乎他們正在V2上工作)。不喜歡它,其他有關XML的Apache項目似乎處于hibernate狀態。我還沒有獨自評估dom4j,只是想知道-Java是否有其他(良好)開源xml解析庫?您對dom4j的體驗如何?
在@Voo回答之后,讓我再問一個-我應該使用Java的內置類還是諸如dom4j之類的任何第三方庫。優點是什么?
相關文章:
1. python - beautifulsoup獲取網頁內容的問題2. Docker for Mac 創建的dnsmasq容器連不上/不工作的問題3. docker鏡像push報錯4. docker - 如何修改運行中容器的配置5. docker-machine添加一個已有的docker主機問題6. fragment - android webView 返回后怎么禁止重新渲染?7. docker不顯示端口映射呢?8. android studio總是在processes running好久9. dockerfile - [docker build image失敗- npm install]10. angular.js - Angular 2 + Django構建的Web應用, 如何合理搭配 ?
