程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> DOM4J介紹與代碼示例

DOM4J介紹與代碼示例

編輯:關於JAVA

DOM4J是dom4j.org出品的一個開源XML解析包。Dom4j是一個易用的、開源的庫,用於XML,XPath和XSLT。它應用於Java平台,采用了Java集合框架並完全支持DOM,SAX和JAXP。

DOM4J下載jar包:http://downloads.sourceforge.net/dom4j/dom4j-1.6.1.jar

JAXEN(對XPath的支持):http://dist.codehaus.org/jaxen/distributions/jaxen-1.1.1.zip

1.DOM4J主要接口

DOM4J主要接口都在org.dom4j這個包裡定義。

-Node為所有的dom4j中XML節點定義了多態行為;

-Branch為能夠包含子節點的節點如XML元素(Element)和文檔(Docuemnts)定義了一個公共的行為;

|-Element 定義XML 元素;

|-Document定義了XML文檔;

-DocumentType 定義XML DOCTYPE聲明;

-Entity定義 XML entity;

-Attribute定義了XML的屬性;

-ProcessingInstruction 定義 XML 處理指令;

-CharacterData是一個標識借口,標識基於字符的節點。如CDATA,Comment, Text;

|- CDATA 定義了XML CDATA 區域;

|-Text 定義XML 文本節點;

|- Comment 定義了XML注釋的行為;

2.創建XML文檔

示例xml:students.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="students.xsl"?>
<students>
   <!--A Student Catalog-->
   <student sn="01">
    <name>sam</name>
    <age>18</age>
   </student>
   <student sn="02">
    <name>lin</name>
    <age>20</age>
   </student>
</students>

下面是用dom4j創建上述文檔,通過兩種方式創建,一種是調用dom4j提供的方法,一種是通過字符串轉換。

XmlGen.java

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.XMLWriter;
public class XmlGen {
   public Document generateDocumentByMethod() {
    Document document = DocumentHelper.createDocument();
    // ProcessingInstruction
    Map<String, String> inMap = new HashMap<String, String>();
    inMap.put("type", "text/xsl");
    inMap.put("href", "students.xsl");
    document.addProcessingInstruction("xml-stylesheet", inMap);
    // root element
    Element studentsElement = document.addElement("students");
    studentsElement.addComment("An Student Catalog");
    // son element
    Element stuElement = studentsElement.addElement("student");
    stuElement.addAttribute("sn", "01");
    Element nameElement = stuElement.addElement("name");
    nameElement.setText("sam");
    Element ageElement = stuElement.addElement("age");
    ageElement.setText("18");
    // son element
    Element anotherStuElement = studentsElement.addElement("student");
    anotherStuElement.addAttribute("sn", "02");
    Element anotherNameElement = anotherStuElement.addElement("name");
    anotherNameElement.setText("lin");
    Element anotherAgeElement = anotherStuElement.addElement("age");
    anotherAgeElement.setText("20");
    return document;
   }
   public Document generateDocumentByString() {
    String text = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>" +
        "<?xml-stylesheet type=\"text/xsl\" href=\"students.xsl\"?>" +
        "<students><!--An Student Catalog--> <student sn=\"01\">" +
        "<name>sam</name><age>18</age></student><student sn=\"02\">" +
        "<name>lin</name><age>20</age></student></students>";
    Document document = null;
    try {
      document = DocumentHelper.parseText(text);
    } catch (DocumentException e) {
      e.printStackTrace();
    }
    return document;
   }
   public void saveDocument(Document document, File outputXml) {
    try {
      // 美化格式
      OutputFormat format = OutputFormat.createPrettyPrint();
      /*// 縮減格式
      OutputFormat format = OutputFormat.createCompactFormat();*/
      /*// 指定XML編碼
       format.setEncoding("GBK");*/
      XMLWriter output = new XMLWriter(new FileWriter(outputXml), format);
      output.write(document);
      output.close();
    } catch (IOException e) {
      System.out.println(e.getMessage());
    }
   }
   public static void main(String[] argv) {
    XmlGen dom4j = new XmlGen();
    Document document = null;
    // document=dom4j.generateDocumentByMethod();
    document = dom4j.generateDocumentByString();
    dom4j.saveDocument(document, new File("output.xml"));
   }
}

方法generateDocumentByMethod()通過調用方法構建xml文檔:

1.使用DocumentHelper得到Document實例

Document document = DocumentHelper.createDocument();

2.創建Processing Instruction

document.addProcessingInstruction("xml-stylesheet", inMap);

3.創建元素Element

Element studentsElement = document.addElement("students");

4.為元素添加注釋Comment

studentsElement.addComment("An Student Catalog");

5.為元素添加屬性

studentsElement.addComment("An Student Catalog");

6.為元素添加文本值Text

ageElement.setText("18");

方法generateDocumentByString()通過字符串轉換直接構建xml文檔,使用DocumentHelper.parseText()來實現.

document = DocumentHelper.parseText(text);

方法saveDocument(Document document, File outputXml)將文檔輸出到文件保存,可指定字符編碼,可指定格式化輸出。

3.修改XML文檔

這裡使用xpath來定位待修改的元素和屬性,需要jaxen的支持。

示例中將students-gen.xml的第一個student元素的sn屬性改為001,其子元素name內容改為jeff。

XmlMod.java

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
public class XmlMod {
   public void modifyDocument(File inputXml) {
    try {
      SAXReader saxReader = new SAXReader();
      Document document = saxReader.read(inputXml);
      List list = document.selectNodes("//students/student/@sn");
      Iterator iter = list.iterator();
      while (iter.hasNext()) {
        Attribute attribute = (Attribute) iter.next();
        if (attribute.getValue().equals("01"))
          attribute.setValue("001");
      }
      list = document.selectNodes("//students/student");
      iter = list.iterator();
      while (iter.hasNext()) {
        Element element = (Element) iter.next();
        Iterator iterator = element.elementIterator("name");
        while (iterator.hasNext()) {
          Element nameElement = (Element) iterator.next();
          if (nameElement.getText().equals("sam"))
           nameElement.setText("jeff");
        }
      }
      XMLWriter output = new XMLWriter(new FileWriter(new File(
          "students-modified.xml")));
      output.write(document);
      output.close();
    }
    catch (DocumentException e) {
      System.out.println(e.getMessage());
    } catch (IOException e) {
      System.out.println(e.getMessage());
    }
   }
   public static void main(String[] argv) {
    XmlMod dom4jParser = new XmlMod();
    dom4jParser.modifyDocument(new File("students-gen.xml"));
   }
}

1.使用File定位文件資源,並基於此獲得Document實例

SAXReader saxReader = new SAXReader();

Document document = saxReader.read(inputXml);

2.Document實例的selectNodes方法可以傳入xpath,並返回一個List實例,基於此使用迭代器,完成特定的應用

List list = document.selectNodes("//students/student/@sn");

4.遍歷XML文檔

這裡提供兩種遍歷方法,一種是基於迭代的遍歷,一種是基於Visitor模式的遍歷。

XmlTra.java

import java.io.File;
import java.util.Iterator;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.ProcessingInstruction;
import org.dom4j.VisitorSupport;
import org.dom4j.io.SAXReader;
public class XmlTra {
   private File inputXml;
   public XmlTra(File inputXml) {
    this.inputXml = inputXml;
   }
   public Document getDocument() {
    SAXReader saxReader = new SAXReader();
    Document document = null;
    try {
      document = saxReader.read(inputXml);
    } catch (DocumentException e) {
      e.printStackTrace();
    }
    return document;
   }
   public Element getRootElement() {
    return getDocument().getRootElement();
   }
   public void traversalDocumentByIterator() {
    Element root = getRootElement();
    // 枚舉根節點下所有子節點
    for (Iterator ie = root.elementIterator(); ie.hasNext();) {
      System.out.println("======");
      Element element = (Element) ie.next();
      System.out.println(element.getName());
      // 枚舉屬性
      for (Iterator ia = element.attributeIterator(); ia.hasNext();) {
        Attribute attribute = (Attribute) ia.next();
        System.out.println(attribute.getName() + ":"
           + attribute.getData());
      }
      // 枚舉當前節點下所有子節點
      for (Iterator ieson = element.elementIterator(); ieson.hasNext();) {
        Element elementSon = (Element) ieson.next();
        System.out.println(elementSon.getName() + ":"
           + elementSon.getText());
      }
    }
   }
   public void traversalDocumentByVisitor() {
    getDocument().accept(new MyVisitor());
   }
   /**
   * 定義自己的訪問者類
   */
   private static class MyVisitor extends VisitorSupport {
    /**
     * 對於屬性節點,打印屬性的名字和值
     */
    public void visit(Attribute node) {
      System.out.println("attribute : " + node.getName() + " = "
          + node.getValue());
    }
    /**
     * 對於處理指令節點,打印處理指令目標和數據
     */
    public void visit(ProcessingInstruction node) {
      System.out.println("PI : " + node.getTarget() + " "
          + node.getText());
    }
    /**
     * 對於元素節點,判斷是否只包含文本內容,如是,則打印標記的名字和 元素的內容。如果不是,則只打印標記的名字
     */
    public void visit(Element node) {
      if (node.isTextOnly())
        System.out.println("element : " + node.getName() + " = "
           + node.getText());
      else
        System.out.println("--------" + node.getName() + "--------");
    }
   }
   public static void main(String[] argv) {
    XmlTra dom4jParser = new XmlTra(new File("students-gen.xml"));
    // dom4jParser.traversalDocumentByIterator();
    dom4jParser.traversalDocumentByVisitor();
   }
}

方法traversalDocumentByIterator()提供一種基於迭代的遍歷實現,每個Element通過elementIterator()和attributeIterator()取代其子元素和屬性的迭代器。

Visitor是GOF設計模式之一。其主要原理就是兩種類互相保有對方的引用,並且一種作為Visitor去訪問許多Visitable。DOM4J中的Visitor模式只需要自定一個類實現Visitor接口即可。

public class MyVisitor extends VisitorSupport {
   public void visit(Element element) {
    System.out.println(element.getName());
   }
   public void visit(Attribute attr) {
    System.out.println(attr.getName());
   }
}

調用: root.accept(new MyVisitor())

Visitor接口提供多種Visit()的重載,根據XML不同的對象,將采用不同的方式來訪問。上面是給出的Element和Attribute的簡單實現,一般比較常用的就是這兩個。VisitorSupport是DOM4J提供的默認適配器,Visitor接口的Default Adapter模式,這個模式給出了各種visit(*)的空實現,以便簡化代碼。

注意,這個Visitor是自動遍歷所有子節點的。如果是root.accept(MyVisitor),將遍歷子節點。我第一次用的時候,認為是需要自己遍歷,便在遞歸中調用Visitor,結果可想而知。

5.使用ElementHandler

XmlHandler.java

import java.io.File;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.ElementHandler;
import org.dom4j.ElementPath;
import org.dom4j.io.SAXReader;
public class XmlHandler {
   public static void main(String[] args) {
    SAXReader saxReader = new SAXReader();
    File file = new File("students.xml");
    try {
      // 添加一個ElementHandler實例。
      saxReader.addHandler("/students/student", new StudentHandler());
      saxReader.read(file);
    } catch (DocumentException e) {
      System.out.println(e.getMessage());
    }
   }
   /**
   * 定義StudentHandler處理器類,對<student>元素進行處理。
   */
   private static class StudentHandler implements ElementHandler {
    public void .Start(ElementPath path) {
      Element elt = path.getCurrent();
      System.out.println("Found student: " + elt.attribut.ue("sn"));
      // 添加對子元素<name>的處理器。
      path.addHandler("name", new NameHandler());
    }
    public void .End(ElementPath path) {
      // 移除對子元素<name>的處理器。
      path.removeHandler("name");
    }
   }
   /**
   * 定義NameHandler處理器類,對<student>的<name>子元素進行處理。
   */
   private static class NameHandler implements ElementHandler {
    public void .Start(ElementPath path) {
      System.out.println("path : " + path.getPath());
    }
    public void .End(ElementPath path) {
      Element elt = path.getCurrent();
      // 輸出<name>元素的名字和它的文本內容。
      System.out.println(elt.getName() + " : " + elt.getText());
    }
   }
}

6.使用XSLT轉換XML

這裡必須使用JAXP的支持。

import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import org.dom4j.Document;
import org.dom4j.io.DocumentResult;
import org.dom4j.io.DocumentSource;
   ……
   public Document styleDocument(Document document, String stylesheet)
      throws Exception {
    // load the transformer using JAXP
    TransformerFactory factory = TransformerFactory.newInstance();
    Transformer transformer = factory.newTransformer(new StreamSource(stylesheet));
    // now lets style the given document
    DocumentSource source = new DocumentSource(document);
    DocumentResult result = new DocumentResult();
    transformer.transform(source, result);
    // return the transformed document
    Document transformedDoc = result.getDocument();
    return transformedDoc;
   }
……

本文出自 “子 孑” 博客,請務必保留此出處http://zhangjunhd.blog.51cto.com/113473/126310

本文配套源碼

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved