首页
/ 正文

XML DOM getElementsByTagName() 方法（长文解析）

更新时间: 2025-04-07 17:29:00

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

在现代 Web 开发和数据处理领域，XML（可扩展标记语言）因其结构化、可扩展的特点，被广泛应用于配置文件、数据交换和信息存储等场景。而 XML DOM（文档对象模型）则为开发者提供了一套标准化的接口，方便我们通过编程方式操作 XML 文档的内容。其中，getElementsByTagName() 方法作为 XML DOM 的核心工具之一，能够高效地定位和操作 XML 元素节点。无论是解析复杂的配置文件，还是从动态生成的 XML 数据中提取特定信息，这一方法都能发挥关键作用。本文将从基础概念到实战案例，深入解析 XML DOM getElementsByTagName() 方法 的原理、使用技巧及常见问题，帮助开发者掌握这一实用技能。

方法的基本用法：定位 XML 元素的“导航仪”

基础语法与功能

getElementsByTagName() 方法用于根据标签名称（tag name）搜索 XML 文档中的所有匹配元素，并返回一个包含这些元素的节点列表（NodeList）。其语法结构如下：

elementList = xmlDocument.getElementsByTagName(tagName);

其中，xmlDocument 是 XML 文档的根节点或某个父节点，tagName 是要搜索的标签名称（大小写敏感）。返回的 elementList 是一个类似数组的对象，支持通过索引访问单个元素。

形象比喻：
可以将 XML DOM 想象为一座图书馆的目录系统，每个标签 <book>、<author> 等对应书架上的分类标签。getElementsByTagName() 就像是图书管理员快速定位所有“小说”类书籍的工具——只需输入类别名称，就能列出所有匹配的书籍位置。

示例：解析书籍目录

假设我们有一个描述书籍信息的 XML 文档：

<library>  
  <book id="1">  
    <title>JavaScript 核心编程</title>  
    <author>张三</author>  
    <year>2023</year>  
  </book>  
  <book id="2">  
    <title>Python 数据分析入门</title>  
    <author>李四</author>  
    <year>2022</year>  
  </book>  
</library>

通过 getElementsByTagName()，我们可以轻松提取所有 <book> 元素：

// 假设 xml 是解析后的 XML 文档对象  
const books = xml.getElementsByTagName("book");  
console.log(books.length); // 输出 2  
console.log(books[0].getElementsByTagName("title")[0].textContent); // 输出 "JavaScript 核心编程"

返回值的特性与注意事项

NodeList 的特性与遍历

getElementsByTagName() 返回的 NodeList 对象具有以下特点：

动态更新：若 XML 文档结构发生变化（如新增或删除节点），NodeList 会自动反映这些变化，无需重新调用方法。
非数组类型：虽然支持索引访问，但 NodeList 不是真正的数组，因此无法直接使用 map()、filter() 等数组方法。

解决方案：
可以通过 Array.from() 将其转换为数组：

const booksArray = Array.from(books);  
booksArray.forEach(book => {  
  console.log(book.getAttribute("id"));  
});

标签名称的大小写敏感性

XML 对标签名称的大小写敏感。例如，getElementsByTagName("Book") 和 getElementsByTagName("book") 将被视为不同的标签名。若需忽略大小写，可先将标签名统一为小写或大写：

// 将标签名转为小写后查询  
const lowerCaseBooks = xml.getElementsByTagName("book");

父节点与子节点的上下文

调用 getElementsByTagName() 时，搜索范围默认从当前节点及其所有后代节点中查找。例如：

// 从根节点 library 开始搜索  
const allTitles = xml.getElementsByTagName("title"); // 包含所有 <title> 标签  

// 仅从第一个 <book> 节点的子节点中搜索  
const firstBookTitles = xml.querySelector("book").getElementsByTagName("title");

进阶用法：结合其他方法与属性

获取元素的文本内容与属性值

获取元素的文本内容时，需结合 textContent 属性：

// 获取第一个 <book> 的作者  
const author = books[0].getElementsByTagName("author")[0].textContent;

若需读取元素的属性（如 id），则使用 getAttribute()：

const bookId = books[0].getAttribute("id"); // 输出 "1"

结合条件判断过滤元素

通过循环遍历 NodeList，可以添加条件筛选：

// 查找所有 2023 年的书籍  
const recentBooks = [];  
for (let i = 0; i < books.length; i++) {  
  const year = books[i].getElementsByTagName("year")[0].textContent;  
  if (year === "2023") {  
    recentBooks.push(books[i]);  
  }  
}

与 CSS 选择器的对比

虽然 getElementsByTagName() 功能强大，但在复杂查询场景下，可结合 querySelector() 或 querySelectorAll() 提升效率：

// 使用 CSS 选择器直接获取所有 <book> 的标题  
const titles = xml.querySelectorAll("book > title");  
titles.forEach(title => {  
  console.log(title.textContent);  
});

常见问题与解决方案

问题 1：返回空列表的可能原因

标签名拼写错误：检查大小写和拼写是否与 XML 中一致。
作用域错误：调用方法的上下文节点是否包含目标标签？例如，若从 <book> 节点调用 getElementsByTagName("library")，则返回空列表。

问题 2：如何获取第一个匹配元素？

直接通过索引 [0] 访问：

const firstBook = books[0];

但需确保列表非空，否则会抛出错误。

问题 3：如何动态修改节点内容？

通过修改 textContent 或 innerHTML 属性：

// 将第一个 <title> 的内容改为新值  
books[0].getElementsByTagName("title")[0].textContent = "新版 JavaScript 核心编程";

实战案例：解析购物车数据

场景描述

假设有一个购物车 XML 数据：

<shopping-cart>  
  <item category="electronics">  
    <name>智能手机</name>  
    <price>2999</price>  
    <quantity>2</quantity>  
  </item>  
  <item category="clothing">  
    <name>运动T恤</name>  
    <price>159</price>  
    <quantity>3</quantity>  
  </item>  
</shopping-cart>

目标是计算特定类别的总金额。

解决步骤

解析 XML 文档：

const parser = new DOMParser();  
const xmlDoc = parser.parseFromString(xmlString, "text/xml");

获取所有 item 元素：

const items = xmlDoc.getElementsByTagName("item");

筛选并计算电子类商品总价：

let total = 0;  
for (let i = 0; i < items.length; i++) {  
  const category = items[i].getAttribute("category");  
  if (category === "electronics") {  
    const price = parseFloat(items[i].getElementsByTagName("price")[0].textContent);  
    const quantity = parseInt(items[i].getElementsByTagName("quantity")[0].textContent);  
    total += price * quantity;  
  }  
}  
console.log("电子类商品总价：", total); // 输出 5998

其他语言的实现示例

Python 中的 `xml.etree.ElementTree`

import xml.etree.ElementTree as ET  

tree = ET.parse("data.xml")  
root = tree.getroot()  

books = root.findall("book")  
for book in books:  
    title = book.find("title").text  
    print(title)

Java 中的 DOM 解析

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();  
DocumentBuilder builder = factory.newDocumentBuilder();  
Document doc = builder.parse("data.xml");  

// 获取所有 <book> 元素  
NodeList books = doc.getElementsByTagName("book");  
for (int i = 0; i < books.getLength(); i++) {  
    Node bookNode = books.item(i);  
    System.out.println(bookNode.getTextContent());  
}

总结与扩展

通过本文的讲解，我们深入理解了 XML DOM getElementsByTagName() 方法 的核心功能、使用技巧及常见问题的解决方法。这一方法不仅是 XML 数据解析的基础工具，还能通过与 getAttribute()、textContent 等方法的结合，实现复杂的数据筛选和操作。

对于开发者而言，掌握该方法后，可进一步探索以下方向：

XPath 查询：通过更灵活的路径语法（如 /library/book[1]）定位节点。
XML 操作：结合 createElement()、appendChild() 等方法动态修改 XML 结构。
性能优化：在处理大规模 XML 文件时，使用事件驱动的解析器（如 SAX）替代 DOM 解析。

希望本文能帮助开发者高效利用 XML DOM 的强大功能，为数据处理和 Web 应用开发提供有力支持。

XML DOM getElementsByTagName() 方法（长文解析）

方法的基本用法：定位 XML 元素的“导航仪”

基础语法与功能

示例：解析书籍目录

返回值的特性与注意事项

NodeList 的特性与遍历

标签名称的大小写敏感性

父节点与子节点的上下文

进阶用法：结合其他方法与属性

获取元素的文本内容与属性值

结合条件判断过滤元素

与 CSS 选择器的对比

常见问题与解决方案

问题 1：返回空列表的可能原因

问题 2：如何获取第一个匹配元素？

问题 3：如何动态修改节点内容？

实战案例：解析购物车数据

场景描述

解决步骤

其他语言的实现示例

Python 中的 `xml.etree.ElementTree`

Java 中的 DOM 解析

总结与扩展

最新发布

JSON 教程（保姆级教程）

Google API 教程（一文讲透）

ADO 教程（保姆级教程）

VBScript 教程（超详细）

ASP.NET 教程（一文讲透）

DTD 教程（建议收藏）

XML DOM 教程（长文讲解）

XSLT 教程（保姆级教程）

XPath 教程（建议收藏）

XQuery 教程（一文讲透）

XML DOM getElementsByTagName() 方法（长文解析）

方法的基本用法：定位 XML 元素的“导航仪”

基础语法与功能

示例：解析书籍目录

返回值的特性与注意事项

NodeList 的特性与遍历

标签名称的大小写敏感性

父节点与子节点的上下文

进阶用法：结合其他方法与属性

获取元素的文本内容与属性值

结合条件判断过滤元素

与 CSS 选择器的对比

常见问题与解决方案

问题 1：返回空列表的可能原因

问题 2：如何获取第一个匹配元素？

问题 3：如何动态修改节点内容？

实战案例：解析购物车数据

场景描述

解决步骤

其他语言的实现示例

Python 中的 xml.etree.ElementTree

Java 中的 DOM 解析

总结与扩展

最新发布

JSON 教程（保姆级教程）

Google API 教程（一文讲透）

ADO 教程（保姆级教程）

VBScript 教程（超详细）

ASP.NET 教程（一文讲透）

DTD 教程（建议收藏）

XML DOM 教程（长文讲解）

XSLT 教程（保姆级教程）

XPath 教程（建议收藏）

XQuery 教程（一文讲透）

Python 中的 `xml.etree.ElementTree`