首页
/ 正文

Python 将一个字符串分割成多个子串（一文讲透）

更新时间: 2025-04-14 04:12:33

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言：字符串分割在编程中的重要性

在 Python 编程中，字符串操作是开发者最常遇到的任务之一。无论是解析配置文件、处理用户输入，还是分析日志数据，Python 将一个字符串分割成多个子串的能力都是解决问题的核心工具。例如，当需要从一段文本中提取日期、数字或特定字段时，字符串分割技术能极大简化开发流程。

本文将系统讲解 Python 中字符串分割的多种方法，从基础函数到高级技巧，结合实际案例帮助读者理解如何灵活运用这些技术。无论你是编程新手还是有一定经验的开发者，都能从中找到适合自己的解决方案。

2. 基础分割方法：`split()` 函数

2.1 `split()` 的基本用法

Python 的 split() 函数是最常用的字符串分割工具。它的核心功能是将字符串按指定分隔符拆分为子串列表。例如：

text = "apple,banana,orange"
fruits = text.split(",")  
print(fruits)  # 输出：['apple', 'banana', 'orange']

这里，字符串 "apple,banana,orange" 通过逗号 , 分隔符被拆分成三个子串。

2.2 分隔符的灵活性

split() 的分隔符可以是任意字符串，甚至包括空格、特殊符号或多个字符组合。例如：

text = "Hello World Python"  
words = text.split(" ")  
print(words)  # 输出：['Hello', 'World', 'Python']

text = "2023-09-15"  
date_parts = text.split("-")  
print(date_parts)  # 输出：['2023', '09', '15']

2.3 无分隔符参数的默认行为

若不指定分隔符，split() 默认按任意空白字符（空格、换行符、制表符等）分割字符串，并自动忽略连续空白处的多余空值。例如：

text = "   Hello   World  "  
words = text.split()  # 不传参数，按空白分割  
print(words)  # 输出：['Hello', 'World']

3. 进阶技巧：控制分割次数与处理空值

3.1 限制分割次数：`split(maxsplit)` 参数

通过 maxsplit 参数可以指定最大分割次数。例如：

text = "a,b,c,d"  
result = text.split(",", 2)  # 最多分割两次  
print(result)  # 输出：['a', 'b', 'c,d']

这里，字符串被分割成三个子串，其中最后一个子串保留未分割的部分。

3.2 处理空白分割后的空列表

当字符串全为空白或分隔符导致分割结果为空时，split() 会返回空列表。例如：

text = "   "  # 全空白字符串  
print(text.split())  # 输出：[]

此时需注意判断列表是否为空，避免后续操作报错。

4. 处理复杂场景：正则表达式 `re.split()`

当分隔符规则复杂时（如包含特殊字符、需要匹配模式），可使用 re.split() 函数。

4.1 基本用法：正则表达式分割

import re  

text = "apple#banana;orange|pear"  
pattern = r"[#;|]"  # 分隔符为 #、; 或 |  
fruits = re.split(pattern, text)  
print(fruits)  # 输出：['apple', 'banana', 'orange', 'pear']

4.2 匹配分组与保留分隔符

若正则表达式中包含括号 ()，则匹配的分隔符也会被保留在结果中：

text = "2023-09-15"  
pattern = r"(-)"  # 匹配连字符并保留  
parts = re.split(pattern, text)  
print(parts)  # 输出：['2023', '-', '09', '-', '15']

5. 特殊场景：处理换行符与多行文本

5.1 `splitlines()` 函数

当需要分割多行文本时，splitlines() 是更合适的选择。它按换行符（\n、\r\n 等）分割字符串，并返回行列表：

text = "Line 1\nLine 2\r\nLine3"  
lines = text.splitlines()  
print(lines)  # 输出：['Line 1', 'Line 2', 'Line3']

5.2 保留换行符选项

通过参数 keepends=True 可保留换行符：

lines_with_end = text.splitlines(keepends=True)  
print(lines_with_end)  # 输出：['Line 1\n', 'Line 2\r\n', 'Line3']

6. 扩展技巧：自定义分割逻辑

6.1 使用生成器表达式

若需动态处理分割结果（如过滤空值或转换类型），可结合生成器表达式：

text = "  100 , 200  , 300  "  
numbers = [int(num.strip()) for num in text.split(",")]  
print(numbers)  # 输出：[100, 200, 300]

6.2 自定义分割函数

对于更复杂的逻辑（如按单词长度分割），可自定义函数：

def split_by_length(s, n):  
    return [s[i:i+n] for i in range(0, len(s), n)]  

text = "abcdefghij"  
result = split_by_length(text, 2)  
print(result)  # 输出：['ab', 'cd', 'ef', 'gh', 'ij']

7. 性能优化与常见问题

7.1 避免内存浪费：迭代分割结果

若字符串非常长（如日志文件），建议使用生成器避免一次性加载全部数据：

def read_lines(file_path):  
    with open(file_path, 'r') as f:  
        for line in f:  
            yield line.strip()  

for line in read_lines("log.txt"):  
    process(line)  # 处理每一行

7.2 空字符串的处理

当分割结果包含空字符串时，可通过 filter() 过滤：

text = "a,,b"  # 中间有空值  
parts = list(filter(None, text.split(",")))  
print(parts)  # 输出：['a', 'b']

8. 实际案例：解析 CSV 文件

假设有一个 CSV 文件 data.csv，内容如下：

name,age,city  
Alice,30,New York  
Bob,25,Los Angeles

使用 split() 解析并提取数据：

with open("data.csv", "r") as f:  
    lines = f.readlines()  
    headers = lines[0].strip().split(",")  # 获取表头  
    for line in lines[1:]:  
        data = line.strip().split(",")  
        print(dict(zip(headers, data)))

9. 结论：选择适合的分割方法

通过本文的讲解，读者应能掌握以下核心知识点：

基础分割：split() 函数及其参数用法。
正则表达式：re.split() 处理复杂模式。
特殊场景：splitlines() 处理多行文本。
性能与扩展：动态处理和自定义逻辑。

在实际开发中，选择方法需根据需求权衡：
| 场景 | 推荐方法 | 优点 |
|--------------------------|------------------------|-------------------------------|
| 简单分隔符（如逗号、空格）| split() | 简单高效，无需导入模块 |
| 复杂分隔符（如正则模式） | re.split() | 灵活性强，支持复杂规则 |
| 处理多行文本 | splitlines() | 自动识别换行符，代码简洁 |

掌握这些技巧后，开发者可以更高效地处理字符串分割任务，无论是处理日志、配置文件，还是解析用户输入，都能游刃有余。

Python 将一个字符串分割成多个子串（一文讲透）

前言：字符串分割在编程中的重要性

2. 基础分割方法：`split()` 函数

2.1 `split()` 的基本用法

2.2 分隔符的灵活性

2.3 无分隔符参数的默认行为

3. 进阶技巧：控制分割次数与处理空值

3.1 限制分割次数：`split(maxsplit)` 参数

3.2 处理空白分割后的空列表

4. 处理复杂场景：正则表达式 `re.split()`

4.1 基本用法：正则表达式分割

4.2 匹配分组与保留分隔符

5. 特殊场景：处理换行符与多行文本

5.1 `splitlines()` 函数

5.2 保留换行符选项

6. 扩展技巧：自定义分割逻辑

6.1 使用生成器表达式

6.2 自定义分割函数

7. 性能优化与常见问题

7.1 避免内存浪费：迭代分割结果

7.2 空字符串的处理

8. 实际案例：解析 CSV 文件

9. 结论：选择适合的分割方法

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

Python 将一个字符串分割成多个子串（一文讲透）

前言：字符串分割在编程中的重要性

2. 基础分割方法：split() 函数

2.1 split() 的基本用法

2.2 分隔符的灵活性

2.3 无分隔符参数的默认行为

3. 进阶技巧：控制分割次数与处理空值

3.1 限制分割次数：split(maxsplit) 参数

3.2 处理空白分割后的空列表

4. 处理复杂场景：正则表达式 re.split()

4.1 基本用法：正则表达式分割

4.2 匹配分组与保留分隔符

5. 特殊场景：处理换行符与多行文本

5.1 splitlines() 函数

5.2 保留换行符选项

6. 扩展技巧：自定义分割逻辑

6.1 使用生成器表达式

6.2 自定义分割函数

7. 性能优化与常见问题

7.1 避免内存浪费：迭代分割结果

7.2 空字符串的处理

8. 实际案例：解析 CSV 文件

9. 结论：选择适合的分割方法

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

2. 基础分割方法：`split()` 函数

2.1 `split()` 的基本用法

3.1 限制分割次数：`split(maxsplit)` 参数

4. 处理复杂场景：正则表达式 `re.split()`

5.1 `splitlines()` 函数