首页
/ 正文

Linux sort命令（长文解析）

更新时间: 2025-03-31 18:00:43

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言

在 Linux 系统中，数据的整理与分析是日常操作的核心任务之一。无论是处理日志文件、统计用户行为，还是对数据库导出的数据进行排序，一个高效且灵活的排序工具都是必不可少的。Linux sort命令正是这样一款强大而易用的工具，它能够快速对文本文件或输入流中的内容进行排序、合并和筛选。对于编程初学者而言，掌握 sort 命令是迈向高效数据处理的第一步；对于中级开发者，深入理解其高级选项和组合技巧则能显著提升工作效率。

本文将从基础用法逐步展开，结合实际案例和代码示例，带读者全面了解 sort 命令的功能与应用场景。

基础用法：排序单列文本

单列文本的默认排序

sort 命令的最简单用法是对单列文本进行升序排序。例如，假设有一个名为 fruits.txt 的文件，内容如下：

apple  
grape  
banana

执行以下命令即可按字母顺序排序：

sort fruits.txt

输出结果为：

apple  
banana  
grape

比喻：这就像在图书馆整理书籍时，按书名的字母顺序将它们排列在书架上。

逆序排序：`-r` 参数

若需降序排列，可添加 -r（reverse）参数：

sort -r fruits.txt

此时输出结果为：

grape  
banana  
apple

数字排序：`-n` 参数

默认情况下，sort 命令按字符逐位比较排序，这可能导致数字排序出现错误。例如，对以下文件 numbers.txt：

100  
2  
50

直接排序会得到：

100  
2  
50

这是因为 sort 将数字视为字符串，按首字符 1、2、5 的 ASCII 值比较。此时需使用 -n 参数指定按数值大小排序：

sort -n numbers.txt

正确输出为：

2  
50  
100

进阶技巧：多列排序与复杂规则

指定排序列：`-k` 参数

实际数据中，文件可能包含多列信息。例如，以下 scores.txt 文件记录了学生的姓名、数学和语文成绩：

Alice 85 90  
Bob 92 78  
Charlie 75 88

若需按数学成绩排序，可使用 -k 参数指定列号：

sort -k 2 -n scores.txt

这里 -k 2 表示按第二列排序，-n 确保数值比较。输出结果为：

Charlie 75 88  
Alice 85 90  
Bob 92 78

多级排序：按多列依次排序

多列排序时，可以像图书馆按“作者→书名”排序书籍一样，使用多个 -k 参数实现。例如，先按语文成绩降序，再按数学成绩升序：

sort -k 3 -nr -k 2 -n scores.txt

解析：

-k 3 -nr：按第三列（语文）数值降序；
-k 2 -n：若语文成绩相同，则按第二列（数学）数值升序。

合并与去重：`-m` 与 `-u` 参数

合并已排序文件：`-m` 参数

若已有两个已排序的文件 scores_A.txt 和 scores_B.txt，可使用 -m 参数将它们合并为一个有序文件：

sort -m scores_A.txt scores_B.txt > merged.txt

注意：合并前需确保两个文件本身已按同一规则排序，否则结果可能不正确。

去除重复行：`-u` 参数

-u（unique）参数可删除重复行。例如，对以下文件 duplicates.txt：

apple  
banana  
apple

执行 sort -u duplicates.txt 将输出：

apple  
banana

实战案例：处理日志文件

按时间排序日志条目

假设日志文件 access.log 记录了用户访问时间（如 2023-09-15 14:30:00），需按时间升序排列：

sort -k 1.1-1.10 -k 2 access.log

解析：

-k 1.1-1.10：按第一列的前10个字符（日期部分）排序；
-k 2：按第二列（时间）进一步细化排序。

统计高频访问IP并排序

若需统计访问次数最多的IP地址，可结合 cut 和 sort：

cut -d ' ' -f 1 access.log | sort | uniq -c | sort -nr

步骤解析：

cut 提取第一列（IP地址）；
sort 排序以便后续统计；
uniq -c 统计重复次数；
最终 sort -nr 按次数降序排列，输出高频IP列表。

高级技巧与注意事项

临时文件与性能优化

对大型文件排序时，sort 会使用临时磁盘空间。通过 -T 参数可指定临时目录，例如：

sort -T /path/to/temp -n large_file.txt

这在内存不足时尤为重要。

大小写敏感排序：`-f` 参数

默认排序区分大小写，若需忽略大小写，可添加 -f 参数：

sort -f mixed_case.txt

例如，对 Apple、banana、grape 排序时，会统一视为小写处理。

逆向与自然排序的结合

若需按文件大小排序（如 ls -l 的输出），可结合 -h（human-readable）和 -r：

ls -lh | sort -k 5 -hr

此命令按第五列（文件大小）以人类可读格式降序排列。

结论

Linux sort命令凭借其灵活性和强大功能，成为数据处理的基石工具。从基础的单列排序到复杂的多列、合并与去重操作，它为开发者提供了高效处理文本数据的解决方案。无论是初学者通过简单参数入门，还是中级开发者通过组合选项应对复杂场景，sort 命令都能显著提升工作效率。

掌握 sort 命令的进阶用法，不仅能帮助用户快速完成日常任务，更能培养系统性处理数据的思维模式。建议读者通过实际案例反复练习，逐步探索更多隐藏功能，让 sort 成为你 Linux 工具箱中的核心成员。

Linux sort命令（长文解析）

前言

基础用法：排序单列文本

单列文本的默认排序

逆序排序：`-r` 参数

数字排序：`-n` 参数

进阶技巧：多列排序与复杂规则

指定排序列：`-k` 参数

多级排序：按多列依次排序

合并与去重：`-m` 与 `-u` 参数

合并已排序文件：`-m` 参数

去除重复行：`-u` 参数

实战案例：处理日志文件

按时间排序日志条目

统计高频访问IP并排序

高级技巧与注意事项

临时文件与性能优化

大小写敏感排序：`-f` 参数

逆向与自然排序的结合

结论

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

Linux sort命令（长文解析）

前言

基础用法：排序单列文本

单列文本的默认排序

逆序排序：-r 参数

数字排序：-n 参数

进阶技巧：多列排序与复杂规则

指定排序列：-k 参数

多级排序：按多列依次排序

合并与去重：-m 与 -u 参数

合并已排序文件：-m 参数

去除重复行：-u 参数

实战案例：处理日志文件

按时间排序日志条目

统计高频访问IP并排序

高级技巧与注意事项

临时文件与性能优化

大小写敏感排序：-f 参数

逆向与自然排序的结合

结论

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）

逆序排序：`-r` 参数

数字排序：`-n` 参数

指定排序列：`-k` 参数

合并与去重：`-m` 与 `-u` 参数

合并已排序文件：`-m` 参数

去除重复行：`-u` 参数

大小写敏感排序：`-f` 参数