首页
/ 正文

XML DOM – 遍历节点树（保姆级教程）

更新时间: 2025-04-08 00:20:50

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

前言

在现代软件开发中，处理结构化数据是开发者的核心任务之一。XML（可扩展标记语言）作为数据存储和交换的通用格式，其灵活性和可读性使其被广泛应用于配置文件、数据传输和跨系统通信。然而，如何高效解析和操作 XML 文档中的节点数据，成为开发者必须掌握的技能。本文将深入探讨 XML DOM – 遍历节点树 的核心概念，通过实际案例和代码示例，帮助读者理解如何系统化地遍历 XML 节点树，并掌握其在实际项目中的应用场景。

XML 节点树的结构解析

节点树的层级关系

XML 文档本质上是一棵由节点构成的树形结构。每个节点可以是元素（Element）、文本（Text）、属性（Attribute）或注释（Comment）等类型。理解节点的层级关系是遍历的基础。

节点的父子关系与兄弟关系

父节点（Parent Node）：每个节点（除根节点外）都有一个直接的父节点。例如，在以下 XML 片段中，<book> 是 <title> 和 <author> 的父节点：
```
<book>  
  <title>Effective JavaScript</title>  
  <author>Nicholas C. Zakas</author>  
</book>  
```
子节点（Child Nodes）：父节点下的直接节点称为子节点。例如，<title> 和 <author> 是 <book> 的子节点。
兄弟节点（Sibling Nodes）：同一父节点下的节点互为兄弟节点。例如，<title> 和 <author> 是兄弟节点。

节点类型与属性

XML 节点支持多种类型，常见的包括：

节点类型	描述
`ELEMENT_NODE`	表示 XML 元素节点，如 `<book>`。
`TEXT_NODE`	表示文本内容节点，如 `<title>` 中的 "Effective JavaScript"。
`ATTRIBUTE_NODE`	表示元素的属性节点，如 `<book id="123">` 中的 `id` 属性。
`COMMENT_NODE`	表示注释节点，如 `<!-- 这是注释 -->`。

核心概念：DOM 节点遍历方法

什么是 DOM 遍历？

DOM（文档对象模型）将 XML 文档映射为树形结构后，开发者可通过编程接口操作这些节点。遍历节点树的核心目标是按特定逻辑访问所有或部分节点，例如查找特定元素、修改节点内容或提取数据。

常用遍历方法

DOM 提供了多种方法实现节点遍历，以下是关键方法的总结：

方法名称	描述
`documentElement`	获取 XML 文档的根节点。
`childNodes`	返回节点的所有子节点列表（包含文本节点和注释节点）。
`firstChild` 和 `lastChild`	获取第一个或最后一个子节点。
`nextSibling` 和 `previousSibling`	获取下一个或上一个兄弟节点。
`hasChildNodes()`	判断节点是否有子节点。

示例：遍历 XML 文档的根节点

假设我们有以下 XML 文档：

<library>  
  <book category="fiction">  
    <title>1984</title>  
    <author>George Orwell</author>  
    <year>1949</year>  
  </book>  
  <book category="non-fiction">  
    <title>Sapiens</title>  
    <author>Yuval Noah Harari</author>  
    <year>2011</year>  
  </book>  
</library>

通过 JavaScript 的 DOM API，可以这样访问根节点：

// 加载 XML 文档  
const parser = new DOMParser();  
const xmlDoc = parser.parseFromString(xmlString, "application/xml");  

// 获取根节点  
const root = xmlDoc.documentElement; // 返回 <library> 元素  
console.log(root.nodeName); // 输出 "library"

深度优先与广度优先遍历策略

遍历节点树的策略直接影响效率和结果。常见的遍历策略包括 深度优先遍历（DFS） 和 广度优先遍历（BFS）。

深度优先遍历（DFS）

DFS 采用“先深入再回溯”的方式，优先访问当前节点的所有子节点，直到到达叶子节点后回溯。例如：

function traverseDFS(node) {  
  if (node.nodeType === Node.ELEMENT_NODE) {  
    console.log(`访问元素节点: ${node.nodeName}`);  
    // 遍历子节点  
    for (let child of node.childNodes) {  
      traverseDFS(child); // 递归调用  
    }  
  }  
}  

// 调用  
traverseDFS(root);

DFS 的优势与适用场景

优势：代码简洁，适合需要优先处理深层节点的场景。
适用场景：查找特定路径的节点（如 <book> -> <title>）。

广度优先遍历（BFS）

BFS 采用“逐层访问”的方式，先访问当前层的所有节点，再进入下一层。例如：

function traverseBFS(rootNode) {  
  const queue = [rootNode];  

  while (queue.length > 0) {  
    const current = queue.shift();  
    if (current.nodeType === Node.ELEMENT_NODE) {  
      console.log(`访问元素节点: ${current.nodeName}`);  
      // 将子节点加入队列  
      for (let child of current.childNodes) {  
        queue.push(child);  
      }  
    }  
  }  
}  

// 调用  
traverseBFS(root);

BFS 的优势与适用场景

优势：避免递归深度过大导致的栈溢出，适合层级较浅的场景。
适用场景：遍历所有同级节点（如所有 <book> 元素）。

实战案例：遍历并提取数据

假设我们需要从 XML 文档中提取所有 <book> 节点的 category 属性和 <title> 内容。

步骤 1：定位根节点

const books = root.getElementsByTagName("book"); // 获取所有 <book> 节点

步骤 2：遍历并提取数据

for (let book of books) {  
  const category = book.getAttribute("category"); // 获取属性值  
  const titleNode = book.querySelector("title"); // 使用 CSS 选择器查找子节点  
  const titleText = titleNode.textContent;  

  console.log(`Category: ${category}, Title: ${titleText}`);  
}

输出结果

Category: fiction, Title: 1984  
Category: non-fiction, Title: Sapiens

高级技巧：优化遍历性能

避免递归的无限深度

递归实现的 DFS 可能导致栈溢出，尤其在处理大型 XML 文件时。可以通过 迭代方式 替代递归：

function traverseDFSIterative(root) {  
  const stack = [root];  

  while (stack.length > 0) {  
    const current = stack.pop();  
    if (current.nodeType === Node.ELEMENT_NODE) {  
      console.log(current.nodeName);  
      // 反向压入子节点以保持顺序  
      for (let i = current.childNodes.length - 1; i >= 0; i--) {  
        stack.push(current.childNodes[i]);  
      }  
    }  
  }  
}

使用 XPath 表达式快速定位节点

XPath 是一种强大的查询语言，可直接定位特定路径的节点。例如：

// 查找所有 <book> 节点下的 <title> 元素  
const titles = xmlDoc.evaluate("//book/title", root, null, XPathResult.ANY_TYPE, null);  
let result = titles.iterateNext();  
while (result) {  
  console.log(result.textContent);  
  result = titles.iterateNext();  
}

结论

掌握 XML DOM – 遍历节点树 是开发者高效操作 XML 数据的关键技能。通过理解节点层级关系、选择合适的遍历策略（DFS/BFS），并结合 XPath 等工具，开发者可以快速实现数据提取、节点修改或结构分析等任务。建议读者通过实际项目不断练习，例如构建 XML 配置解析器或数据转换工具，以巩固对节点树遍历的理解。

希望本文能为你的 XML 开发之路提供清晰的指引，如果对特定场景有疑问，欢迎在评论区交流！

XML DOM – 遍历节点树（保姆级教程）

前言

XML 节点树的结构解析

节点树的层级关系

节点的父子关系与兄弟关系

节点类型与属性

核心概念：DOM 节点遍历方法

什么是 DOM 遍历？

常用遍历方法

示例：遍历 XML 文档的根节点

深度优先与广度优先遍历策略

深度优先遍历（DFS）

DFS 的优势与适用场景

广度优先遍历（BFS）

BFS 的优势与适用场景

实战案例：遍历并提取数据

步骤 1：定位根节点

步骤 2：遍历并提取数据

输出结果

高级技巧：优化遍历性能

避免递归的无限深度

使用 XPath 表达式快速定位节点

结论

最新发布

HTML DOM Style listStyleType 属性（长文解析）

HTML DOM Style margin 属性（建议收藏）

HTML DOM Style marginBottom 属性（建议收藏）

HTML DOM Style marginLeft 属性（一文讲透）

HTML DOM Style marginRight 属性（超详细）

HTML DOM Style marginTop 属性（超详细）

HTML DOM Style padding 属性（长文讲解）

HTML DOM Style paddingBottom 属性（一文讲透）

HTML DOM Style paddingLeft 属性（长文讲解）

HTML DOM Style paddingRight 属性（长文讲解）