首页
/ 正文

Python 判断两个字符串是否是 anagram（千字长文）

更新时间: 2025-04-14 04:36:01

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

前言

在编程领域，判断两个字符串是否为anagram是一个经典问题。Anagram 指的是两个字符串通过重新排列字符后可以完全一致的情况，例如 "listen" 和 "silent" 就是典型的 anagram。这一问题不仅在算法面试中常见，也在密码学、文本分析等领域有实际应用。本文将从基础概念入手，逐步讲解 Python 中实现这一判断的多种方法，并通过案例和代码示例帮助读者深入理解其实现原理。

什么是 Anagram？

Anagram（变位词）是两个或多个单词通过重新排列字符后完全相同的字符串。例如：

"binary" 和 "brainy" 是 anagram
"restful" 和 "fluster" 是 anagram

形象地说，可以将 anagram 理解为“字母积木游戏”——如果两个字符串的“字母积木”数量和种类完全相同，那么它们就是 anagram。

方法一：排序比较法（Sort and Compare）

实现原理

最直观的方法是将两个字符串分别排序，然后比较排序后的结果是否相同。例如：

def is_anagram_sort(s1, s2):  
    return sorted(s1.lower()) == sorted(s2.lower())

关键点解析

排序操作：sorted() 函数会将字符串转换为字符列表并排序，例如 sorted("listen") 会得到 ['e', 'i', 'l', 'n', 's', 't']。
忽略大小写：通过 .lower() 方法将字符串统一转为小写，避免因大小写不同导致的误判。
时间复杂度：排序的时间复杂度为 O(n log n)，其中 n 是字符串长度。

示例代码与测试

print(is_anagram_sort("listen", "silent"))  # 输出：True  
print(is_anagram_sort("Hello", "World"))    # 输出：False

方法二：字符计数法（Count Characters）

实现原理

通过统计每个字符在两个字符串中的出现次数，判断是否完全一致。例如：

def is_anagram_count(s1, s2):  
    # 统计字符出现次数  
    count = {}  
    for char in s1.lower():  
        count[char] = count.get(char, 0) + 1  
    for char in s2.lower():  
        if char not in count:  
            return False  
        count[char] -= 1  
        if count[char] < 0:  
            return False  
    return all(value == 0 for value in count.values())

关键点解析

字典计数：使用字典 count 记录每个字符的出现次数。
遍历处理：
- 首先遍历第一个字符串，统计字符数量。
- 然后遍历第二个字符串，若字符不存在或数量不足，则直接返回 False。
最终校验：通过 all() 函数确保所有字符计数归零。

优化版本：使用 `collections.Counter`

Python 的 collections.Counter 类可以简化代码：

from collections import Counter  

def is_anagram_counter(s1, s2):  
    return Counter(s1.lower()) == Counter(s2.lower())

方法三：哈希函数法（Hashing）

实现原理

通过自定义哈希函数将字符串映射为唯一值，若两个字符串的哈希值相同，则可能是 anagram。但需注意哈希碰撞的风险（即不同字符串可能生成相同哈希值）。

示例代码

def get_hash(s):  
    prime = 31  # 选择一个质数  
    hash_val = 0  
    for char in s.lower():  
        hash_val = hash_val * prime + ord(char)  
    return hash_val  

def is_anagram_hash(s1, s2):  
    return get_hash(s1) == get_hash(s2)

注意事项

哈希碰撞：虽然概率低，但无法完全避免。因此，哈希法更适合初步筛选，而非最终判断。
性能优化：哈希计算的时间复杂度为 O(n)，但需权衡哈希函数设计的合理性。

性能对比与选择建议

时间复杂度总结

方法名称	时间复杂度	空间复杂度
排序比较法	O(n log n)	O(n)
字符计数法	O(n)	O(1)（字符集固定）
Counter 计数法	O(n)	O(n)
哈希法	O(n)	O(1)

选择建议

简单场景：推荐使用排序比较法或 Counter，代码简洁且易于理解。
性能敏感场景：优先选择字符计数法或哈希法，时间复杂度更低。
极端情况：需处理超长字符串时，哈希法可能更高效，但需结合其他方法验证。

进阶优化：提前终止判断

在实际应用中，可以通过以下方式进一步优化：

长度检查：若两个字符串长度不同，直接返回 False。
提前退出循环：在计数过程中，若发现某个字符数量不足，立即终止循环。

优化后的计数法代码示例

def is_anagram_optimized(s1, s2):  
    if len(s1) != len(s2):  
        return False  
    count = [0] * 26  # 假设只处理小写字母  
    for char in s1.lower():  
        index = ord(char) - ord('a')  
        count[index] += 1  
    for char in s2.lower():  
        index = ord(char) - ord('a')  
        count[index] -= 1  
        if count[index] < 0:  
            return False  
    return True

实际应用场景

案例 1：密码学中的挑战

在密码学中，anagram 可用于生成随机密钥或验证数据完整性。例如，通过随机排列字符串生成密钥，解密时需确保 anagram 判断正确。

案例 2：编程面试题

许多面试题会要求实现一个高效的 anagram 判断函数，例如：

题目：给定两个字符串，判断是否互为 anagram，要求时间复杂度低于 O(n log n)。
解答：使用字符计数法或哈希法。

常见错误与解决方案

错误 1：忽略大小写

def is_anagram_error(s1, s2):  
    return sorted(s1) == sorted(s2)  

print(is_anagram_error("Listen", "silent"))  # 输出：False（因大小写不同）

解决方案：使用 .lower() 或 .upper() 统一字符大小写。

错误 2：未处理空格或特殊字符

某些场景下字符串可能包含空格或标点符号，需先进行清洗：

def preprocess(s):  
    return ''.join(c for c in s.lower() if c.isalnum())  

s1 = "anagram!"  
s2 = "nag a ram"  
print(is_anagram_sort(preprocess(s1), preprocess(s2)))  # 输出：True

结论

判断两个字符串是否为 anagram 是 Python 中一个典型的问题，其核心在于字符的重新排列与统计。通过本文的讲解，读者可以掌握三种主要方法（排序、计数、哈希）的实现原理与适用场景，并根据实际需求选择最优方案。无论是编程学习、算法面试，还是实际项目开发，这一技能都能帮助开发者更高效地处理字符串相关的逻辑问题。

附：完整代码示例

def is_anagram_sort(s1, s2):  
    return sorted(s1.lower()) == sorted(s2.lower())  

def is_anagram_counter(s1, s2):  
    from collections import Counter  
    return Counter(s1.lower()) == Counter(s2.lower())  

def is_anagram_optimized(s1, s2):  
    if len(s1) != len(s2):  
        return False  
    count = [0] * 26  
    for char in s1.lower():  
        count[ord(char) - ord('a')] += 1  
    for char in s2.lower():  
        count[ord(char) - ord('a')] -= 1  
        if count[ord(char) - ord('a')] < 0:  
            return False  
    return True

通过本文的学习，读者不仅能解决具体的技术问题，还能理解不同算法设计背后的逻辑与权衡，为更复杂的编程挑战打下坚实基础。

Python 判断两个字符串是否是 anagram（千字长文）

前言

什么是 Anagram？

方法一：排序比较法（Sort and Compare）

实现原理

关键点解析

示例代码与测试

方法二：字符计数法（Count Characters）

实现原理

关键点解析

优化版本：使用 `collections.Counter`

方法三：哈希函数法（Hashing）

实现原理

示例代码

注意事项

性能对比与选择建议

时间复杂度总结

选择建议

进阶优化：提前终止判断

优化后的计数法代码示例

实际应用场景

案例 1：密码学中的挑战

案例 2：编程面试题

常见错误与解决方案

错误 1：忽略大小写

错误 2：未处理空格或特殊字符

结论

最新发布

Bootstrap5 输入框组（手把手讲解）

Bootstrap5 表单浮动标签（长文解析）

Bootstrap5 表单验证（手把手讲解）

CSS conic-gradient() 函数（手把手讲解）

CSS counter() 函数（超详细）

CSS max() 函数（长文讲解）

CSS min() 函数（一文讲透）

CSS repeating-conic-gradient() 函数（手把手讲解）

Julia 语言环境安装（手把手讲解）

Julia 交互式命令（建议收藏）

Python 判断两个字符串是否是 anagram（千字长文）

前言

什么是 Anagram？

方法一：排序比较法（Sort and Compare）

实现原理

关键点解析

示例代码与测试

方法二：字符计数法（Count Characters）

实现原理

关键点解析

优化版本：使用 collections.Counter

方法三：哈希函数法（Hashing）

实现原理

示例代码

注意事项

性能对比与选择建议

时间复杂度总结

选择建议

进阶优化：提前终止判断

优化后的计数法代码示例

实际应用场景

案例 1：密码学中的挑战

案例 2：编程面试题

常见错误与解决方案

错误 1：忽略大小写

错误 2：未处理空格或特殊字符

结论

最新发布

Bootstrap5 输入框组（手把手讲解）

Bootstrap5 表单浮动标签（长文解析）

Bootstrap5 表单验证（手把手讲解）

CSS conic-gradient() 函数（手把手讲解）

CSS counter() 函数（超详细）

CSS max() 函数（长文讲解）

CSS min() 函数（一文讲透）

CSS repeating-conic-gradient() 函数（手把手讲解）

Julia 语言环境安装（手把手讲解）

Julia 交互式命令（建议收藏）

优化版本：使用 `collections.Counter`