首页
/ 正文

XML DOM（保姆级教程）

更新时间: 2025-03-19 23:18:04

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

前言

在现代软件开发中，数据的存储与交互是核心问题之一。XML（可扩展标记语言）作为一种灵活且通用的数据描述格式，广泛应用于配置文件、数据交换、服务接口等领域。而XML DOM（文档对象模型）则是操作XML文档的核心工具，它通过将XML文档解析为树形结构的对象，让开发者能够像操作普通对象一样读取、修改和创建XML内容。

本文将从XML的基础概念出发，逐步深入解析DOM的原理、操作方法及实际应用场景。无论是编程新手还是有一定经验的开发者，都能通过本文掌握如何高效使用XML DOM技术，解决实际开发中的数据处理问题。

XML 基础：理解数据描述语言

XML 的基本语法与用途

XML（eXtensible Markup Language）通过自定义标签对数据进行结构化描述。例如，以下代码片段展示了用户信息的XML表示：

<user>  
  <name>John Doe</name>  
  <age>30</age>  
  <email>john.doe@example.com</email>  
</user>

每个标签（如<user>）定义了数据的结构，而标签之间的内容则是具体的值。XML的可扩展性使其能够适应不同业务场景的需求，例如：

配置文件：存储应用程序的运行参数。
数据交换：通过API传递结构化数据（如RSS订阅内容）。
存储复杂数据：如游戏存档、XML数据库等。

XML 的局限性与DOM的必要性

虽然XML语法直观，但直接操作文本形式的XML存在诸多不便：

搜索困难：若需查找某个节点，需逐行遍历文本，效率低下。
修改复杂：添加或删除节点时，容易因格式错误导致数据损坏。
跨语言兼容性：不同编程语言对XML的解析逻辑差异较大。

此时，DOM（Document Object Model）便成为解决这些问题的关键技术。

XML DOM 核心概念：对象化文档结构

DOM 的工作原理

DOM将XML文档解析为一个树形对象结构，每个节点（如标签、属性、文本）都被封装为对象，并通过父子层级关系连接。这种设计类似于文件系统的目录结构：

根节点：XML文档的最顶层节点（如<user>）。
子节点：直接嵌套在父节点内的标签（如<name>是<user>的子节点）。
属性节点：标签的附加信息（如<age type="integer">30</age>中的type属性）。

关键术语与类比

术语	定义	形象比喻
节点（Node）	XML文档中的最小单位，包括元素、文本、注释等。	图书馆中的每本书或书架
元素（Element）	具有标签名的节点，如`<user>`。	图书馆中的分类标签（如“小说区”）
属性（Attribute）	附加在元素上的键值对，如`<age type="integer">`中的`type`。	书本的ISBN编号或作者信息
文本节点（Text Node）	存储元素内的纯文本内容，如`John Doe`。	书本内的文字内容

操作 XML DOM 的核心方法

解析 XML 文档

解析是DOM操作的第一步，不同编程语言提供了不同的API。以下以JavaScript和Python为例：

JavaScript 示例（使用 `DOMParser`）

const xmlString = `<user>  
  <name>John Doe</name>  
  <age>30</age>  
</user>`;  

// 创建解析器并生成DOM对象  
const parser = new DOMParser();  
const xmlDoc = parser.parseFromString(xmlString, "application/xml");  

// 通过XPath获取元素  
const nameNode = xmlDoc.querySelector("name");  
console.log(nameNode.textContent); // 输出："John Doe"

Python 示例（使用 `xml.etree.ElementTree`）

import xml.etree.ElementTree as ET  

xml_data = """  
<user>  
  <name>John Doe</name>  
  <age>30</age>  
</user>  
"""  

root = ET.fromstring(xml_data)  

for child in root:  
    print(child.tag, child.text)

常用操作：查询、修改与创建节点

1. 查询节点

DOM提供了多种查询方式，如：

XPath：一种路径表达式，用于精准定位节点。

// 查询所有<name>元素  
const names = xmlDoc.querySelectorAll("name");

属性访问：通过元素名或属性值过滤。

# 查询具有特定属性的元素  
element = root.find(".//age[@type='integer']")

2. 修改节点内容

// 修改<age>的文本内容  
const ageNode = xmlDoc.querySelector("age");  
ageNode.textContent = "31";

3. 动态创建节点

new_email = ET.SubElement(root, "email", attrib={"type": "work"})  
new_email.text = "john.doe@work.com"

实战案例：解析与修改配置文件

场景描述

假设我们需要开发一个天气应用，其配置文件config.xml存储了API密钥和城市列表：

<config>  
  <api_key>ABC123</api_key>  
  <cities>  
    <city id="1" name="Tokyo" />  
    <city id="2" name="New York" />  
  </cities>  
</config>

案例目标

读取API密钥和城市列表。
动态添加新的城市。

JavaScript 实现

// 解析配置文件  
const parser = new DOMParser();  
const configXml = parser.parseFromString(configXmlString, "application/xml");  

// 获取API密钥  
const apiKey = configXml.querySelector("api_key").textContent;  

// 获取所有城市  
const cities = configXml.querySelectorAll("cities > city");  
cities.forEach(cityNode => {  
  console.log(`ID: ${cityNode.getAttribute("id")}, Name: ${cityNode.getAttribute("name")}`);  
});  

// 添加新城市  
const newCity = configXml.createElement("city");  
newCity.setAttribute("id", "3");  
newCity.setAttribute("name", "London");  

configXml.querySelector("cities").appendChild(newCity);

Python 实现

import xml.etree.ElementTree as ET  

tree = ET.parse("config.xml")  
root = tree.getroot()  

api_key = root.find("api_key").text  

for city in root.findall(".//city"):  
    print(f"ID: {city.get('id')}, Name: {city.get('name')}")  

new_city = ET.Element("city", {"id": "3", "name": "London"})  
root.find("cities").append(new_city)  

tree.write("config.xml")

XML DOM 的进阶技巧与注意事项

1. 处理命名空间（Namespaces）

当XML文档包含多个来源的标签时，需使用命名空间避免冲突。例如：

<ns:user xmlns:ns="http://example.com/user">  
  <ns:name>John Doe</ns:name>  
</ns:user>

在JavaScript中，可使用localName属性：

const userNode = xmlDoc.querySelector("ns|user", {  
  "ns": "http://example.com/user"  
});

2. 性能优化

DOM操作可能导致内存占用过高，尤其处理大型文档时，建议：

使用流式解析（如SAX解析器）替代DOM的全内存加载。
避免频繁修改DOM结构，尽量批量操作后再更新。

3. 安全性与验证

使用XML Schema（XSD）或DTD验证文档结构，防止无效数据。
对用户输入的XML内容进行过滤，防范XXE（XML外部实体）攻击。

结论

XML DOM作为操作XML文档的核心工具，为开发者提供了直观、高效的数据操作能力。通过将文档转换为对象树，开发者可以轻松实现复杂的数据查询、修改和扩展，从而应对配置管理、数据集成等实际场景。

无论是通过JavaScript的DOMParser还是Python的xml.etree.ElementTree，掌握DOM的原理与方法，都能显著提升开发效率。随着对DOM技术的深入理解，开发者将进一步解锁其在API集成、自动化脚本、跨平台数据同步等领域的潜力。

希望本文能帮助你建立起对XML DOM的系统性认知，并为实际项目提供有价值的参考。

XML DOM（保姆级教程）

前言

XML 基础：理解数据描述语言

XML 的基本语法与用途

XML 的局限性与DOM的必要性

XML DOM 核心概念：对象化文档结构

DOM 的工作原理

关键术语与类比

操作 XML DOM 的核心方法

解析 XML 文档

JavaScript 示例（使用 `DOMParser`）

Python 示例（使用 `xml.etree.ElementTree`）

常用操作：查询、修改与创建节点

1. 查询节点

2. 修改节点内容

3. 动态创建节点

实战案例：解析与修改配置文件

场景描述

案例目标

JavaScript 实现

Python 实现

XML DOM 的进阶技巧与注意事项

1. 处理命名空间（Namespaces）

2. 性能优化

3. 安全性与验证

结论

最新发布

jQuery.each()方法（长文解析）

jQuery.extend()方法（长文解析）

jQuery.fn.extend()方法（千字长文）

jQuery.globalEval()方法（长文讲解）

jQuery.grep() 方法（长文讲解）

jQuery.inArray() 方法（长文讲解）

jQuery.isArray() 方法（手把手讲解）

jQuery.isEmptyObject() 方法（千字长文）

jQuery.isFunction() 方法（建议收藏）

jQuery.isNumeric() 方法（手把手讲解）

XML DOM（保姆级教程）

前言

XML 基础：理解数据描述语言

XML 的基本语法与用途

XML 的局限性与DOM的必要性

XML DOM 核心概念：对象化文档结构

DOM 的工作原理

关键术语与类比

操作 XML DOM 的核心方法

解析 XML 文档

JavaScript 示例（使用 DOMParser）

Python 示例（使用 xml.etree.ElementTree）

常用操作：查询、修改与创建节点

1. 查询节点

2. 修改节点内容

3. 动态创建节点

实战案例：解析与修改配置文件

场景描述

案例目标

JavaScript 实现

Python 实现

XML DOM 的进阶技巧与注意事项

1. 处理命名空间（Namespaces）

2. 性能优化

3. 安全性与验证

结论

最新发布

jQuery.each()方法（长文解析）

jQuery.extend()方法（长文解析）

jQuery.fn.extend()方法（千字长文）

jQuery.globalEval()方法（长文讲解）

jQuery.grep() 方法（长文讲解）

jQuery.inArray() 方法（长文讲解）

jQuery.isArray() 方法（手把手讲解）

jQuery.isEmptyObject() 方法（千字长文）

jQuery.isFunction() 方法（建议收藏）

jQuery.isNumeric() 方法（手把手讲解）

JavaScript 示例（使用 `DOMParser`）

Python 示例（使用 `xml.etree.ElementTree`）