首页
/ 正文

RegExp $ 量词（千字长文）

更新时间: 2025-04-09 00:47:55

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

正则表达式量词与锚点的深度解析：掌握$符号与量词的协同作用

前言：为什么学习RegExp中的量词和$符号？

正则表达式（RegExp）是编程中处理文本的强大工具，而量词和锚点则是其核心语法。量词（如*、+、?）控制字符或模式的重复次数，而$符号作为锚点，表示匹配字符串的结尾。对于编程初学者和中级开发者而言，理解这两者的结合使用，能够显著提升文本处理的效率与准确性。本文将通过循序渐进的方式，结合实际案例，深入解析正则表达式中量词的逻辑与$符号的协同作用，帮助读者构建清晰的逻辑框架。

一、正则表达式基础回顾：字符、元字符与锚点

在深入量词之前，需先明确正则表达式的基本构成：

普通字符：如字母a、数字5，直接匹配自身。
元字符：如.、*、$，具有特殊含义。
锚点：如^（匹配字符串开头）和$（匹配字符串结尾），用于限定匹配的位置。

例如，正则表达式/^\d+$/表示：

^：从字符串开头开始匹配。
\d+：匹配一个或多个数字。
$：确保匹配到字符串结尾。
因此，该正则仅允许由纯数字组成的字符串通过验证。

二、量词的核心概念：控制重复次数的“语法开关”

1. 基础量词及其含义

量词是正则表达式中用于指定重复次数的关键符号，常见类型包括：
| 量词 | 含义 | 示例 |
|------|--------------------------|--------------------------|
| * | 匹配前项 0次或多次 | /a*b/ 匹配 b、ab、aaab |
| + | 匹配前项 1次或多次 | /a+b/ 匹配 ab、aaab，不匹配 b |
| ? | 匹配前项 0次或1次 | /a?b/ 匹配 ab、b |
| {n}| 匹配前项 恰好n次 | /a{3}/ 匹配 aaa |

2. 形象比喻：量词是“文本的尺子”

想象量词是测量文本长度的尺子：

* 是一根弹性无限的尺子，可以完全收缩（0次）或无限延伸。
+ 是一根至少展开一次的尺子，确保至少测量一次。
{n} 是一把固定长度的标尺，严格要求匹配n次。

代码示例（JavaScript）：

// 匹配以0或多个字母开头，接着是"cat"的字符串  
const regex = /^[a-z]*cat/;  
console.log(regex.test("cat")); // true  
console.log(regex.test("xycat")); // true

三、量词的贪婪与非贪婪模式：如何控制“贪吃”的匹配行为？

1. 贪婪模式（默认行为）

默认情况下，量词会尽可能多地匹配文本。例如：

// 匹配从"a"到"b"之间的所有字符  
const regex = /a.*b/;  
const str = "a123xbyab";  
console.log(str.match(regex)); // 输出 "a123xbyab"

此处的.*会一直匹配到字符串中最后一个b，导致结果超出预期。

2. 非贪婪模式（通过`?`实现）

在量词后添加?，可切换为非贪婪模式，即尽可能少地匹配：

const regex = /a.*?b/;  
console.log(str.match(regex)); // 输出 "ab"

此时，.*?仅匹配到第一个b，避免过度匹配。

3. 比喻理解：贪婪模式是“贪吃蛇”，非贪婪是“谨慎食客”

贪婪模式：像贪吃蛇一样，尽可能吃掉所有符合条件的内容。
非贪婪模式：像节食者，只吃最小量的匹配。

四、$符号的特殊作用：锚定字符串的“终点站”

1. $符号的核心功能

$是正则表达式中的结尾锚点，确保模式匹配到字符串的末尾。例如：

// 匹配以".com"结尾的字符串  
const regex = /\.com$/;  
console.log(regex.test("example.com")); // true  
console.log(regex.test("example.com.cn")); // false

若忽略$，则.com可能匹配到中间的.com部分，导致误判。

2. $与量词的协同：精准定位匹配范围

通过结合量词和$，可实现复杂验证：

案例1：验证邮箱格式
```
const emailRegex = /^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/;  
```
此正则要求：
- 用户名部分：至少一个字符（+）。
- 域名部分：包含至少一个点（通过$确保结尾为域名后缀）。
案例2：密码强度验证
```
const passwordRegex = /^(?=.*\d)[A-Za-z\d!@#$%^&*]{8,}$/;  
```
此正则要求：
- 至少8个字符（{8,}$）。
- 必须包含数字（通过正向预查(?=.*\d)）。

五、常见误区与进阶技巧：避免踩坑的实战经验

1. 忽略$符号导致的错误

// 错误案例：未锚定结尾，导致匹配不完整  
const regex = /\d+/; // 本意是验证纯数字字符串  
console.log(regex.test("123abc")); // 输出true（错误匹配）

修正方法：添加^和$：

const regex = /^\d+$/;

2. 贪婪模式引发的性能问题

在处理长字符串时，过度使用贪婪量词可能导致正则引擎执行缓慢。例如：

// 高风险正则：可能无限回溯  
const regex = /.*".*"/; // 尝试匹配双引号内的内容

优化方法：改用非贪婪模式或精确限定：

const regex = /"([^"]*)"/; // 匹配双引号内非引号字符

3. 组合使用量词与$的进阶场景

验证电话号码格式：

const phoneRegex = /^\+?\d{1,3}-\d{3}-\d{4}$/;  
// 匹配如：+86-138-0013 或 138-0013

提取文件扩展名：

const fileName = "report.pdf";  
const extRegex = /\.(\w+)$/;  
console.log(fileName.match(extRegex)[1]); // 输出 "pdf"

六、结论：量词与$符号的“黄金组合”

掌握正则表达式中的量词（如*、+、?）和$符号，能够显著提升文本处理的精度与效率。通过结合锚点$和量词，开发者可以：

精准控制匹配范围（如要求字符串以特定模式结尾）。
避免过度匹配或遗漏关键条件。
构建复杂的验证逻辑（如密码、邮箱、电话号码校验）。

建议读者通过以下步骤深化理解：

动手练习：使用在线正则测试工具（如Regex101）尝试不同组合。
分析案例：拆解已有的正则表达式，理解量词与锚点的协作逻辑。
关注性能：在处理大数据时，优先选择非贪婪模式和精确限定。

通过持续实践，量词与$符号的协同使用将成为开发者手中灵活的“文本手术刀”，在数据清洗、表单验证等场景中发挥关键作用。

RegExp $ 量词（千字长文）

正则表达式量词与锚点的深度解析：掌握$符号与量词的协同作用

前言：为什么学习RegExp中的量词和$符号？

一、正则表达式基础回顾：字符、元字符与锚点

二、量词的核心概念：控制重复次数的“语法开关”

1. 基础量词及其含义

2. 形象比喻：量词是“文本的尺子”

三、量词的贪婪与非贪婪模式：如何控制“贪吃”的匹配行为？

1. 贪婪模式（默认行为）

2. 非贪婪模式（通过`?`实现）

3. 比喻理解：贪婪模式是“贪吃蛇”，非贪婪是“谨慎食客”

四、$符号的特殊作用：锚定字符串的“终点站”

1. $符号的核心功能

2. $与量词的协同：精准定位匹配范围

五、常见误区与进阶技巧：避免踩坑的实战经验

1. 忽略$符号导致的错误

2. 贪婪模式引发的性能问题

3. 组合使用量词与$的进阶场景

六、结论：量词与$符号的“黄金组合”

最新发布

C 语言实例 – 计算数组元素平均值（长文讲解）

C 语言实例 – 查找数组中最大的元素值（长文解析）

C 语言实例 – 计算标准偏差（建议收藏）

C 语言实例 – 两个矩阵相加（长文解析）

C 语言实例 – 矩阵转换（千字长文）

C 语言实例 – 使用指针访问数组元素（手把手讲解）

C 语言实例 – 使用引用循环替换数值（一文讲透）

C 语言实例 – 判断最大值（长文讲解）

C 语言实例 – 查找字符在字符串中出现的次数（建议收藏）

C 语言实例 – 字符串中各种字符计算（一文讲透）

RegExp $ 量词（千字长文）

正则表达式量词与锚点的深度解析：掌握$符号与量词的协同作用

前言：为什么学习RegExp中的量词和$符号？

一、正则表达式基础回顾：字符、元字符与锚点

二、量词的核心概念：控制重复次数的“语法开关”

1. 基础量词及其含义

2. 形象比喻：量词是“文本的尺子”

三、量词的贪婪与非贪婪模式：如何控制“贪吃”的匹配行为？

1. 贪婪模式（默认行为）

2. 非贪婪模式（通过?实现）

3. 比喻理解：贪婪模式是“贪吃蛇”，非贪婪是“谨慎食客”

四、$符号的特殊作用：锚定字符串的“终点站”

1. $符号的核心功能

2. $与量词的协同：精准定位匹配范围

五、常见误区与进阶技巧：避免踩坑的实战经验

1. 忽略$符号导致的错误

2. 贪婪模式引发的性能问题

3. 组合使用量词与$的进阶场景

六、结论：量词与$符号的“黄金组合”

最新发布

C 语言实例 – 计算数组元素平均值（长文讲解）

C 语言实例 – 查找数组中最大的元素值（长文解析）

C 语言实例 – 计算标准偏差（建议收藏）

C 语言实例 – 两个矩阵相加（长文解析）

C 语言实例 – 矩阵转换（千字长文）

C 语言实例 – 使用指针访问数组元素（手把手讲解）

C 语言实例 – 使用引用循环替换数值（一文讲透）

C 语言实例 – 判断最大值（长文讲解）

C 语言实例 – 查找字符在字符串中出现的次数（建议收藏）

C 语言实例 – 字符串中各种字符计算（一文讲透）

2. 非贪婪模式（通过`?`实现）