DOM 的有效使用
考虑到由 DOM 设计强加的限制,如何才能有效和高效的使用该规范呢?下面是使用 DOM 的几条基本原则和方针,以及使工作更方便的函数库。 如果您遵循几条基本原则,您使用 DOM 的经验将会显著提高: 这些原则直接从对常见问题的研究中得到。正如上面所讨论的,DOM 遍历是出错的主要原因。但它也是最常需要的功能之一。如何通过不使用 DOM 而遍历文档呢? XPath 是寻址、搜索和匹配文档的各个部分的语言。它是 W3C 推荐标准(Recommendation),并且在大多数语言和 XML 包中实现。您的 DOM 包可能直接支持 XPath 或通过加载件(add-on)支持。本文的样本代码对于 XPath 支持使用 Xalan 包。 XPath 使用路径标记法来指定和匹配文档的各个部分,该标记法与文件系统和 URL 中使用的类似。例如,XPath: 更为复杂的匹配可能同时在包含文档的结构方面以及在节点及其属性的值中。语句 详细探讨 XPath 及其用法超出了本文的范围。请参阅 参考资料获得一些优秀教程的链接。花点时间学习 XPath,您将会更方便的处处理 XML 文档。 DOM 的语言无关性设计为其带来了非常广泛的可应用性并使其在大量的系统和平台上得以实现。这样做的代价是:使 DOM 比为每个语言专门设计的 API 更困难且更缺乏直观性。 DOM 奠定了一个非常有效的基础,遵循一些简单的原则就可其上构建易于使用的系统。凝结了一大群用户智慧和经验的 DOM 未来版本正在设计之中,而且极有可能为这里讨论的问题提供解决方案。如 JDOM 这样的项目正在修改该 API 以获得更自然 Java 感觉,而且如本文中所述的技术可以帮助您使 XML 的操纵更方便、更简洁并且不易出错。利用这些项目且遵循这些用法模式以允许 DOM 成为基于 XML 项目的出色平台。 DOM解析XML、修改Node的属性: package com.lph.html; import java.io.*; public class TestDom {
/x/y/z
搜索文档的根节点 x
,其下存在节点 y
,其下存在节点 z
。该语句返回与指定路径结构匹配的所有节点。/x/y/*
返回父节点为 x
的 y
节点下的任何节点。 /x/y[@name='a']
匹配所有父节点为 x
的 y
节点,其属性称为 name
,属性值为 a
。请注意,XPath 处理筛选空格文本节点以获得实际的元素节点 ― 它只返回元素节点。
import java.util.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;
public static void main(String arge[]) {
long lasting = System.currentTimeMillis();
try {
File f = new File("D:/data_10k.xml");
DocumentBuilderFactory factory = DocumentBuilderFactory
.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(f);
NodeList nl = doc.getElementsByTagName("VALUE");
for (int i = 0; i < nl.getLength(); i++) {
Node node=nl.item(i);
node.getAttributes().getNamedItem("name").setNodeValue("www");
System.out.print("车牌号码:"
+ doc.getElementsByTagName("NO").item(i)
.getFirstChild().getNodeValue());
System.out.println("车主地址:"
+ doc.getElementsByTagName("ADDR").item(i)
.getFirstChild().getNodeValue());
}
} catch (Exception e) {
e.printStackTrace();
}
}
}