首页
/ 正文

Python 使用 filter 和 map 函数处理数据（长文解析）

更新时间: 2025-04-14 02:00:49

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言

在数据处理领域，Python 的 filter 和 map 函数是两个功能强大的工具，它们能够以简洁的方式实现数据筛选和转换。对于编程初学者和中级开发者而言，掌握这两个函数不仅能提升代码效率，还能更深入理解函数式编程的核心思想。本文将通过循序渐进的讲解、形象的比喻和实际案例，帮助读者系统掌握如何用 filter 和 map 函数高效处理数据。

什么是 filter 和 map 函数？

在 Python 中，filter 和 map 属于高阶函数（Higher-Order Functions），它们接受其他函数作为参数，并对数据进行批量操作。

filter 函数：作用如同“筛子”，用于过滤数据中符合条件的元素。
map 函数：类似“传送带”，对数据中的每个元素应用指定函数并返回处理后的结果。

函数式编程的直观比喻

想象你有一个装满不同水果的篮子：

filter 像一个挑剔的分拣员，只留下符合要求的水果（例如“红色的苹果”）。
map 则像一个自动包装机，将每个水果包装成礼盒（例如“给每个苹果贴上标签”）。

通过这种比喻，读者可以快速理解两个函数的核心功能。

filter 函数：数据筛选的艺术

基础语法

filter(function, iterable) 的基本结构如下：

function：一个返回布尔值的函数（或 None），用于判断元素是否保留。
iterable：待处理的数据集合（如列表、元组等）。

示例 1：筛选偶数

numbers = [1, 2, 3, 4, 5, 6]  
def is_even(num):  
    return num % 2 == 0  

filtered = filter(is_even, numbers)  
print(list(filtered))  # 输出：[2, 4, 6]

示例 2：使用 lambda 表达式简化代码

filtered_lambda = filter(lambda x: x % 2 == 0, numbers)  
print(list(filtered_lambda))  # 同样输出：[2, 4, 6]

关键特性

惰性求值：filter 返回的是一个迭代器，需通过 list() 或循环显式转换为可读形式。
保留原始数据结构：不会修改原数据，而是返回新数据集合。

map 函数：批量数据转换

基础语法

map(function, iterable, ...) 的结构如下：

function：对每个元素执行的操作（可以是自定义函数或内置函数）。
iterable：待处理的数据集合。

示例 1：将温度从摄氏度转换为华氏度

celsius_temps = [0, 25, 37, 100]  
def celsius_to_fahrenheit(c):  
    return c * 9/5 + 32  

fahrenheit_temps = map(celsius_to_fahrenheit, celsius_temps)  
print(list(fahrenheit_temps))  # 输出：[32.0, 77.0, 98.6, 212.0]

示例 2：对字符串列表首字母大写

names = ["alice", "bob", "charlie"]  
capitalized = map(str.capitalize, names)  
print(list(capitalized))  # 输出：["Alice", "Bob", "Charlie"]

关键特性

逐元素处理：对每个元素独立执行函数，返回处理后的结果。
支持多输入序列：若传入多个迭代器（如 map(add, [1,2], [3,4]），函数会并行处理元素对。

filter 与 map 的协同使用

场景：综合筛选与转换

假设我们有一个学生成绩列表，需要筛选出分数高于 60 的学生，并将他们的分数转换为百分比格式：

students = [  
    {"name": "Amy", "score": 58},  
    {"name": "Bob", "score": 75},  
    {"name": "Claire", "score": 92}  
]  

passed_students = filter(lambda s: s["score"] > 60, students)  

def format_score(student):  
    return f"{student['name']}: {student['score']}%"  

formatted_scores = map(format_score, passed_students)  

print(list(formatted_scores))

协同逻辑解析

filter 先过滤：保留符合条件的元素（如成绩 >60）。
map 后转换：对筛选后的结果进一步处理（如格式化字符串）。
通过组合使用，代码逻辑清晰且简洁。

进阶技巧：灵活运用 lambda 和列表推导式

1. 用 lambda 表达式替代冗余函数

在简单场景中，用 lambda 可以减少代码量：

def square(x):  
    return x ** 2  

squared = list(map(square, [1, 2, 3]))  

squared = list(map(lambda x: x ** 2, [1, 2, 3]))

2. 列表推导式 vs. map/filter

虽然 map 和 filter 功能强大，但列表推导式（List Comprehensions）在可读性和简洁性上常更优：

even_squares = list(map(lambda x: x**2, filter(lambda x: x % 2 == 0, range(10))))  

even_squares = [x**2 for x in range(10) if x % 2 == 0]

3. 处理嵌套结构

对于字典或对象列表，需结合 lambda 访问属性：

users = [  
    {"name": "John", "age": 25},  
    {"name": "Jane", "age": 30}  
]  

filtered_names = map(lambda u: u["name"], filter(lambda u: u["age"] > 25, users))  
print(list(filtered_names))  # 输出：["Jane"]

性能与适用场景分析

1. 运行效率对比

map/filter：底层实现为 C 语言，对简单操作（如数学计算）效率较高。
列表推导式：通常比 map/filter 更快，且语法更直观。

测试示例（使用 timeit）：

import timeit  

setup = "import math"  
stmt_listcomp = "[math.sqrt(x) for x in range(1000)]"  
stmt_map = "list(map(math.sqrt, range(1000)))"  

print("列表推导式:", timeit.timeit(stmt_listcomp, setup, number=1000))  
print("map 函数:", timeit.timeit(stmt_map, setup, number=1000))

2. 适用场景建议

使用 filter：当需要明确区分“保留/丢弃”逻辑时（如数据清洗）。
使用 map：当需要对每个元素执行统一操作且结果需保留所有元素时（如数据标准化）。
混合使用：在数据流水线中，先筛选再转换，逻辑清晰且可维护。

常见误区与解决方案

误区 1：忘记将迭代器转换为列表

numbers = [1, 2, 3]  
squared = map(lambda x: x**2, numbers)  
print(squared)  # 输出：<map object at 0x...>  
print(list(squared))  # 输出：[1, 4, 9]

误区 2：误用 `None` 作为 `filter` 的条件函数

filtered = filter(None, [0, 1, "", "text"])  
print(list(filtered))  # 输出：[1, "text"]（因 0 和 "" 被视为 False）  
filtered = filter(lambda x: True, [0, 1, "", "text"])

误区 3：忽略多参数 `map` 的并行逻辑

a = [1, 2]  
b = [3, 4, 5]  
summed = map(lambda x, y: x + y, a, b)  
print(list(summed))  # 输出：[4, 6]（因以较短的列表长度为准）

结论

通过本文，读者应已掌握如何使用 filter 和 map 函数高效处理数据。这两个函数不仅是 Python 的语法糖，更是函数式编程思想的直观体现。在实际开发中，合理结合它们与列表推导式，可以显著提升代码的简洁性和可读性。

对于初学者，建议从简单案例入手，逐步尝试复杂数据结构（如嵌套字典、对象列表）的处理；中级开发者则可探索更高级的用法（如与 lambda 结合、处理多参数迭代）。记住，实践是掌握工具的唯一捷径——尝试用 filter 和 map 重构你的代码，你会发现数据处理从未如此优雅！

关键点总结（表格）

场景需求	使用函数	示例代码片段
筛选偶数列表	`filter`	`filter(lambda x: x%2 ==0, nums)`
转换摄氏度为华氏度	`map`	`map(lambda c: c*9/5+32, temps)`
综合筛选与格式化	`filter` + `map`	`map(..., filter(..., data))`
处理嵌套字典列表	`lambda` + `map`	`map(lambda x: x['score'], data)`

（表格前后各空一行）

通过本文的系统讲解，读者应能自信地将 filter 和 map 函数融入日常开发中，进一步提升数据处理的效率与代码质量。

Python 使用 filter 和 map 函数处理数据（长文解析）

前言

什么是 filter 和 map 函数？

函数式编程的直观比喻

filter 函数：数据筛选的艺术

基础语法

示例 1：筛选偶数

示例 2：使用 lambda 表达式简化代码

关键特性

map 函数：批量数据转换

基础语法

示例 1：将温度从摄氏度转换为华氏度

示例 2：对字符串列表首字母大写

关键特性

filter 与 map 的协同使用

场景：综合筛选与转换

协同逻辑解析

进阶技巧：灵活运用 lambda 和列表推导式

1. 用 lambda 表达式替代冗余函数

2. 列表推导式 vs. map/filter

3. 处理嵌套结构

性能与适用场景分析

1. 运行效率对比

2. 适用场景建议

常见误区与解决方案

误区 1：忘记将迭代器转换为列表

误区 2：误用 None 作为 filter 的条件函数

误区 3：忽略多参数 map 的并行逻辑

结论

关键点总结（表格）

最新发布

Rider 2025.1.1 最新破解版安装教程（附激活码~）

Clion 2025.1 最新激活码，破解版安装教程（至2099年~）

GoLand 2025.1 最新激活码，破解版安装教程（至2099年~）

PhpStorm 2025.1 最新破解版安装教程（附激活码~）

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

误区 2：误用 `None` 作为 `filter` 的条件函数

误区 3：忽略多参数 `map` 的并行逻辑