首页
/ 正文

Python 判断字符串中是否包含某个子字符串（保姆级教程）

更新时间: 2025-04-14 04:09:58

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

在编程的世界中，字符串操作是基础且高频的需求。无论是验证用户输入、解析日志文件，还是处理自然语言文本，开发者常常需要判断一个字符串是否包含特定的子字符串。这一看似简单的任务背后，却隐藏着多种实现方法和优化技巧。本文将从编程初学者的角度出发，结合具体案例和代码示例，系统讲解 Python 中判断字符串是否包含子字符串的多种方法，并通过性能对比和实际场景应用，帮助读者全面掌握这一核心技能。

一、基础方法：`in` 运算符

1.1 什么是 `in` 运算符

在 Python 中，最直观的判断方式是使用 in 运算符。它如同一位“文本侦探”，能够快速扫描主字符串的每个字符，判断目标子字符串是否存在。例如：

text = "Hello World"  
substring = "World"  
if substring in text:  
    print("子字符串存在！")  
else:  
    print("未找到子字符串")

运行结果：

子字符串存在！

1.2 深入理解 `in` 运算符的特性

大小写敏感：默认情况下，in 运算符区分大小写。例如，"world" in "Hello World" 会返回 False。
支持切片逻辑：可以结合切片操作，限定搜索范围。例如，substring in text[5:] 会从主字符串的第6个字符开始搜索。
多模式扩展：通过逻辑运算符（如 and、or）可组合多个条件。例如：
```
if "Hello" in text and "Python" not in text:  
    print("符合特定条件")  
```

1.3 实际案例：用户输入验证

假设需要检查用户输入的邮箱是否包含“@”符号：

email = input("请输入邮箱地址：")  
if "@" in email and "." in email:  
    print("邮箱格式有效")  
else:  
    print("请输入有效的邮箱地址")

二、进阶方法：`str.startswith()` 和 `str.endswith()`

2.1 定位开头与结尾的特殊能力

当需要判断子字符串是否位于字符串的起始或末尾时，startswith() 和 str.endswith() 方法能提供更精准的控制。例如：

path = "/usr/local/bin/python"  
if path.startswith("/usr"):  
    print("路径以 /usr 开头")  

if path.endswith("python"):  
    print("路径以 python 结尾")

运行结果：

路径以 /usr 开头  
路径以 python 结尾

2.2 多模式匹配与元组参数

这两个方法支持同时检查多个可能的子字符串，只需将目标字符串放入元组中：

file_type = "report.xlsx"  
if file_type.endswith((".doc", ".pdf", ".xlsx")):  
    print("支持的文件类型")  
else:  
    print("不支持的格式")

2.3 性能优势与适用场景

与 in 运算符不同，startswith() 和 endswith() 在定位开头或结尾时，算法效率更高（时间复杂度为 O(k)，k 为子字符串长度）。因此，当明确需要检查字符串边界时，优先使用这些方法。

三、正则表达式：`re` 模块的灵活应用

3.1 从简单到复杂的模式匹配

当需要判断的子字符串包含通配符、重复模式或动态规则时，正则表达式（Regular Expression）成为更强大的工具。例如，验证电话号码格式：

import re  

phone = "138-1234-5678"  
pattern = r"\d{3}-\d{4}-\d{4}"  # 匹配形如 123-4567-8901 的格式  
if re.search(pattern, phone):  
    print("电话号码格式正确")  
else:  
    print("格式错误")

3.2 正则表达式的核心语法与比喻

可以将正则表达式想象为“文本解码器”：

\d 表示任意数字，如同“数字探测器”；
+ 和 * 表示重复次数，类似“无限放大镜”；
() 用于分组，如同“文本抓取器”。

通过组合这些符号，可以构建复杂的匹配逻辑。例如，检查日志中的错误信息：

log_entry = "ERROR 404: File not found"  
if re.search(r"ERROR \d{3}", log_entry):  
    print("检测到错误代码")

3.3 性能优化：预编译正则表达式

对于需要多次匹配的场景，使用 re.compile() 预编译正则表达式可以显著提升效率：

pattern = re.compile(r"^[A-Z][a-z]+$")  # 匹配首字母大写、其余小写的单词  
text_list = ["Hello", "world", "Python3"]  
for word in text_list:  
    if pattern.match(word):  
        print(f"{word} 符合格式")

四、方法对比与性能测试

4.1 时间复杂度分析

方法	时间复杂度	适用场景
`in` 运算符	O(n)	简单存在性判断
`startswith`/`endswith`	O(k)	检查开头/结尾的固定模式
`re.search`	O(n*m)	复杂模式匹配（m为模式长度）

4.2 实际性能测试案例

通过 timeit 模块对比不同方法在长字符串中的表现：

import timeit  

long_text = "A" * 1000000 + "B" * 1000  
substring = "B" * 100  

def test_in():  
    return substring in long_text  

def test_re():  
    import re  
    return re.search(substring, long_text) is not None  

print("in 运算符耗时:", timeit.timeit(test_in, number=1000))  
print("正则表达式耗时:", timeit.timeit(test_re, number=1000))

测试结果显示：在简单模式下，in 运算符通常比正则表达式更快；而在复杂模式下，正则表达式的优势逐渐显现。

五、实战场景与代码优化技巧

5.1 动态子字符串处理

在需要根据条件动态生成子字符串时，可以结合字符串拼接和条件判断：

search_term = "error" if is_case_sensitive else "Error"  
if search_term in log_line:  
    # 处理逻辑

5.2 处理大小写不敏感的匹配

通过将字符串统一转为小写（或大写）实现不区分大小写的判断：

text = "Python is FUN"  
if "fun" in text.lower():  
    print("找到子字符串")

5.3 处理多行文本的高效方案

对于多行文本，可以使用 in 运算符或 re 模块的 re.DOTALL 标志：

multi_line = """第一行  
第二行包含目标  
第三行"""  

if "目标" in multi_line:  
    print("直接找到")  

import re  
if re.search(r"第二行.*目标", multi_line, re.DOTALL):  
    print("正则匹配成功")

六、常见误区与解决方案

6.1 字符编码问题

当处理非 ASCII 字符时，需确保字符串和子字符串的编码一致。例如：

chinese_text = "中文字符串"  
if "中文" in chinese_text:  
    print("找到")  

byte_substring = b"中文"  
if byte_substring.decode("utf-8") in chinese_text:  
    print("找到")

6.2 空字符串与边界条件

当子字符串为空时，所有字符串均会返回 True，需在代码中显式处理：

def safe_in_check(text, substring):  
    if not substring:  
        raise ValueError("子字符串不能为空")  
    return substring in text

结论

通过本文的讲解，我们系统梳理了 Python 中判断字符串是否包含子字符串的多种方法：从基础的 in 运算符，到边界限定的 startswith/endswith，再到灵活强大的正则表达式。这些方法各有优劣，需根据具体场景选择最优方案。无论是处理用户输入验证、日志分析，还是文本挖掘任务，掌握这些技巧都能显著提升开发效率。

在实际开发中，建议优先使用 in 运算符处理简单存在性判断，用 startswith/endswith 优化边界条件，而将正则表达式保留给复杂模式需求。同时，通过性能测试和编码规范的实践，读者可以进一步优化代码的健壮性和运行效率。希望本文能成为你 Python 文本处理旅程中的可靠指南！

Python 判断字符串中是否包含某个子字符串（保姆级教程）

一、基础方法：`in` 运算符

1.1 什么是 `in` 运算符

1.2 深入理解 `in` 运算符的特性

1.3 实际案例：用户输入验证

二、进阶方法：`str.startswith()` 和 `str.endswith()`

2.1 定位开头与结尾的特殊能力

2.2 多模式匹配与元组参数

2.3 性能优势与适用场景

三、正则表达式：`re` 模块的灵活应用

3.1 从简单到复杂的模式匹配

3.2 正则表达式的核心语法与比喻

3.3 性能优化：预编译正则表达式

四、方法对比与性能测试

4.1 时间复杂度分析

4.2 实际性能测试案例

五、实战场景与代码优化技巧

5.1 动态子字符串处理

5.2 处理大小写不敏感的匹配

5.3 处理多行文本的高效方案

六、常见误区与解决方案

6.1 字符编码问题

6.2 空字符串与边界条件

结论

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

Python 判断字符串中是否包含某个子字符串（保姆级教程）

一、基础方法：in 运算符

1.1 什么是 in 运算符

1.2 深入理解 in 运算符的特性

1.3 实际案例：用户输入验证

二、进阶方法：str.startswith() 和 str.endswith()

2.1 定位开头与结尾的特殊能力

2.2 多模式匹配与元组参数

2.3 性能优势与适用场景

三、正则表达式：re 模块的灵活应用

3.1 从简单到复杂的模式匹配

3.2 正则表达式的核心语法与比喻

3.3 性能优化：预编译正则表达式

四、方法对比与性能测试

4.1 时间复杂度分析

4.2 实际性能测试案例

五、实战场景与代码优化技巧

5.1 动态子字符串处理

5.2 处理大小写不敏感的匹配

5.3 处理多行文本的高效方案

六、常见误区与解决方案

6.1 字符编码问题

6.2 空字符串与边界条件

结论

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

一、基础方法：`in` 运算符

1.1 什么是 `in` 运算符

1.2 深入理解 `in` 运算符的特性

二、进阶方法：`str.startswith()` 和 `str.endswith()`

三、正则表达式：`re` 模块的灵活应用