首页
/ 正文

使用 Python 实现一个支持排序和查找功能的链表（长文讲解）

更新时间: 2025-04-13 17:42:51

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

在数据结构的世界中，链表（Linked List）如同一条灵活的链条，每个节点通过指针串联，形成动态的数据存储结构。与数组不同，链表在插入和删除操作上具有天然优势，尤其适合需要频繁修改数据结构的场景。本文将通过 Python 实现一个支持排序和查找功能的链表，帮助读者理解链表的核心原理，并掌握其在实际开发中的应用技巧。

一、链表的基本实现

1.1 节点（Node）的定义

链表的最小单位是节点。每个节点包含两个部分：数据域（data） 和 指针域（next）。数据域用于存储实际数据，而指针域指向下一个节点。我们可以用 Python 类来表示节点：

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None  # 初始时，指针指向 None

比喻：想象你正在组装一列火车，每个车厢（节点）都有自己的载货空间（data）和一个指向下一个车厢的钩子（next）。

1.2 链表（LinkedList）的构建

链表由多个节点组成，通常需要一个 头指针（head） 来标记链表的起始位置。链表的基本操作包括添加节点、删除节点和遍历链表：

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):
        """在链表末尾添加节点"""
        new_node = Node(data)
        if not self.head:  # 如果链表为空
            self.head = new_node
            return
        current = self.head
        while current.next:
            current = current.next
        current.next = new_node

    def traverse(self):
        """遍历链表并打印所有节点数据"""
        current = self.head
        while current:
            print(current.data, end=" -> ")
            current = current.next
        print("None")

示例：

ll = LinkedList()
ll.append(10)
ll.append(20)
ll.append(30)
ll.traverse()  # 输出：10 -> 20 -> 30 -> None

二、链表的排序功能实现

2.1 排序的必要性

链表的无序性可能导致查找效率低下。例如，若需要频繁查找特定值，未排序的链表需要遍历所有节点，时间复杂度为 O(n)。通过排序，可以将查找时间降至 O(log n)（如二分查找），但需要先完成排序操作。

2.2 插入排序（Insertion Sort）

插入排序适合链表结构，因为其无需频繁移动数据，只需调整指针即可。实现步骤如下：

初始化一个哨兵节点（sentinel）作为排序后的链表的起始点。
遍历原链表，将每个节点插入到已排序链表的正确位置。

def insertion_sort(self):
    sentinel = Node(0)  # 哨兵节点
    current = self.head
    while current:
        prev_node = sentinel
        # 找到插入位置
        while prev_node.next and prev_node.next.data < current.data:
            prev_node = prev_node.next
        # 保存当前节点的下一个节点
        next_node = current.next
        # 将 current 插入到 prev_node 之后
        current.next = prev_node.next
        prev_node.next = current
        # 继续处理下一个节点
        current = next_node
    self.head = sentinel.next

示例：

ll = LinkedList()
ll.append(30)
ll.append(10)
ll.append(20)
ll.insertion_sort()
ll.traverse()  # 输出：10 -> 20 -> 30 -> None

三、链表的查找功能实现

3.1 顺序查找（Sequential Search）

顺序查找是最基础的查找方式，适用于未排序的链表。其逻辑是逐个遍历节点，直到找到目标值或到达链表末尾：

def search(self, target):
    current = self.head
    while current:
        if current.data == target:
            return True
        current = current.next
    return False

3.2 优化：结合排序后的链表使用二分查找

虽然链表无法像数组一样通过索引快速访问中间节点，但可以通过跳跃指针的方式实现近似二分查找。例如，使用递归或迭代法逐步缩小搜索范围：

def binary_search(self, target):
    if not self.head:
        return False
    # 快慢指针找到中间节点
    slow = self.head
    fast = self.head
    while fast and fast.next:
        fast = fast.next.next
        slow = slow.next
    # 递归查找左右两半部分
    return self._binary_search_helper(self.head, slow, target)

def _binary_search_helper(self, left, right, target):
    if not left or left.data > target:
        return False
    if left.data == target:
        return True
    if right and right.data == target:
        return True
    # 递归处理左半部分和右半部分
    mid = left
    while mid.next != right:
        mid = mid.next
    return self._binary_search_helper(left.next, mid, target) or \
           self._binary_search_helper(mid.next, right, target)

注意：此方法仅在链表已排序时有效，且时间复杂度为 O(log n)。

四、性能分析与优化建议

4.1 链表与数组的对比

操作类型	链表时间复杂度	数组时间复杂度
插入/删除（头部）	O(1)	O(n)
插入/删除（中间）	O(n)	O(n)
查找（顺序）	O(n)	O(n)
查找（二分）	O(log n)	O(log n)

4.2 优化建议

双向链表（Doubly Linked List）：通过添加前驱指针，支持双向遍历，但增加内存开销。
跳跃表（Skip List）：通过多级索引加速查找，但实现复杂度较高。
结合排序使用：若数据频繁被查找，可定期对链表排序以提升效率。

五、实际案例：日志处理系统

假设我们需要设计一个日志处理系统，要求：

动态追加日志：每天生成的新日志需追加到链表末尾。
按时间排序：日志按时间戳排序，以便快速查找特定时间段的日志。
快速查找：根据关键字（如错误代码）快速定位日志。

class LogNode(Node):
    def __init__(self, timestamp, message):
        super().__init__((timestamp, message))

class LogLinkedList(LinkedList):
    def sort_by_time(self):
        self.insertion_sort()  # 按时间戳排序

    def search_by_keyword(self, keyword):
        current = self.head
        while current:
            if keyword in current.data[1]:
                print(f"Time: {current.data[0]}, Message: {current.data[1]}")
            current = current.next

示例用法：

log_ll = LogLinkedList()
log_ll.append(1630456800, "System started")
log_ll.append(1630456900, "Error 404: File not found")
log_ll.sort_by_time()
log_ll.search_by_keyword("Error")

六、总结与扩展思考

本文通过 Python 实现一个支持排序和查找功能的链表，逐步讲解了链表的基础操作、排序算法和优化策略。链表的灵活性使其在动态数据场景中表现优异，但查找效率的瓶颈需要通过排序或混合结构（如哈希表+链表）来弥补。

对于进一步学习，读者可尝试以下挑战：

实现链表的逆序输出。
将链表与哈希表结合，实现 O(1) 时间复杂度的查找。
优化插入排序算法的内存使用效率。

通过实践与思考，你将更深入理解链表在数据结构中的核心地位，并掌握如何根据实际需求选择或设计高效的数据结构。

使用 Python 实现一个支持排序和查找功能的链表（长文讲解）

一、链表的基本实现

1.1 节点（Node）的定义

1.2 链表（LinkedList）的构建

二、链表的排序功能实现

2.1 排序的必要性

2.2 插入排序（Insertion Sort）

三、链表的查找功能实现

3.1 顺序查找（Sequential Search）

3.2 优化：结合排序后的链表使用二分查找

四、性能分析与优化建议

4.1 链表与数组的对比

4.2 优化建议

五、实际案例：日志处理系统

六、总结与扩展思考

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）