首页
/ 正文

MySQL GROUP BY 语句（建议收藏）

更新时间: 2025-03-23 15:33:54

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

引言：为什么需要数据分组？

在数据库操作中，我们常常需要对数据进行分类统计，例如计算某类产品总销量、统计用户活跃区域分布，或分析不同时间段的订单趋势。这些场景的核心需求是将数据按照特定规则“分组”，再对每组数据进行聚合计算。MySQL GROUP BY 语句正是实现这一功能的核心工具。
就像图书馆管理员需要将书籍按类别、作者或出版时间分类整理一样，GROUP BY 将数据库中的数据“分门别类”，帮助开发者从海量数据中提取有价值的信息。本文将通过循序渐进的方式，结合实际案例，深入解析 GROUP BY 语句的语法、规则和最佳实践。

一、GROUP BY 的基础语法与核心概念

1.1 基础语法结构

GROUP BY 的基本语法如下：

SELECT 列1, 列2, 聚合函数(列3)
FROM 表名
WHERE 条件
GROUP BY 列1, 列2;

关键点解释：

分组依据：GROUP BY 后的列（如列1、列2）决定了数据如何被分组。例如，按“省份”分组时，所有同省份的记录会被归为一组。
聚合函数：必须与 GROUP BY 配合使用的函数，如 SUM()（求和）、COUNT()（计数）、AVG()（平均值）、MAX()/MIN()（最大/最小值）。这些函数对每组数据进行计算，生成一个汇总值。

1.2 简单案例：统计订单总金额

假设有一个 orders 表，包含以下字段： | 字段名 | 说明 | |----------|--------------| | order_id | 订单编号 | | user_id | 用户ID | | product | 商品名称 | | amount | 订单金额 | | province | 用户所在省份 |

需求：按省份统计各地区的订单总金额。
SQL 语句：

SELECT province, SUM(amount) AS total_amount
FROM orders
GROUP BY province;

输出结果：

+------------+---------------+
| province   | total_amount  |
+------------+---------------+
| 北京       | 150000        |
| 上海       | 220000        |
| 广东       | 310000        |
+------------+---------------+

二、GROUP BY 的分组规则与注意事项

2.1 “分组列必须出现在 SELECT 或聚合函数中” 规则

MySQL 要求，如果在 SELECT 中指定了非聚合函数的列（如 province），该列必须包含在 GROUP BY 子句中。
错误示例：

SELECT province, user_id, SUM(amount)
FROM orders
GROUP BY province;

此语句会报错，因为 user_id 未出现在 GROUP BY 中，且非聚合函数。

修正方法：

将 user_id 添加到 GROUP BY：
```
GROUP BY province, user_id;
```

或对 user_id 使用聚合函数（如统计每个省份的用户数量）：

SELECT province, COUNT(DISTINCT user_id) AS user_count
FROM orders
GROUP BY province;

2.2 分组顺序与数据量影响

GROUP BY 的分组顺序与 ORDER BY 无关，但分组字段的数据量会影响查询性能。例如，对 product（假设包含1000种商品）和 province（34个省份）同时分组时，实际分组数量为两者组合的总数（如 1000×34=34000 组），可能导致性能下降。

三、GROUP BY 与其他子句的配合使用

3.1 结合 HAVING 筛选分组结果

HAVING 子句用于对分组后的结果进行条件过滤，类似于 WHERE 对原始数据的筛选，但作用对象是聚合后的数据。

案例：统计订单总金额超过 20 万的省份

SELECT province, SUM(amount) AS total_amount
FROM orders
GROUP BY province
HAVING total_amount > 200000;

3.2 结合 ORDER BY 排序分组结果

通过 ORDER BY 可以对分组后的结果进行排序。例如，按总金额从高到低排列：

SELECT province, SUM(amount) AS total_amount
FROM orders
GROUP BY province
ORDER BY total_amount DESC;

3.3 结合 DISTINCT 去重分组

若需统计不同用户的数量而非订单数量，可用 COUNT(DISTINCT user_id)：

SELECT province, COUNT(DISTINCT user_id) AS unique_users
FROM orders
GROUP BY province;

四、GROUP BY 的高级用法与常见场景

4.1 多字段分组：构建多维统计

通过多个分组字段，可实现更细粒度的分析。例如，统计各省份、商品类别的销售额：

SELECT province, product_category, SUM(amount) AS total_sales
FROM orders
GROUP BY province, product_category;

4.2 窗口函数与 GROUP BY 的对比

窗口函数（如 ROW_NUMBER()、SUM() OVER()）允许在不进行分组的情况下对数据进行分区计算，适合需要保留原始行数据的场景。例如，计算每个用户的订单累计金额：

SELECT 
  user_id,
  order_date,
  amount,
  SUM(amount) OVER(PARTITION BY user_id ORDER BY order_date) AS cumulative_amount
FROM orders;

而 GROUP BY 的结果会将每组合并为一行，适合统计汇总数据。

4.3 性能优化技巧

合理使用索引：对 GROUP BY 的字段建立索引，加速分组操作。
避免过早分组：先通过 WHERE 筛选数据，再分组（如先过滤出某时间段的数据再统计）。
分页优化：对大数据量分组后需分页时，可结合 LIMIT 和子查询优化性能。

五、GROUP BY 的常见问题与解决方案

5.1 未指定聚合函数导致的错误

错误信息：
Error Code: 1055. Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column

原因：MySQL 5.7+ 默认开启 ONLY_FULL_GROUP_BY 模式，要求非聚合列必须出现在 GROUP BY 中。
解决方法：

检查 SELECT 中的非聚合列，确保其在 GROUP BY 中或使用聚合函数。

5.2 空值（NULL）的处理

GROUP BY 会将所有 NULL 值视为同一组。例如：

SELECT status, COUNT(*) FROM orders GROUP BY status;

若存在 NULL 值的记录，会单独显示为 NULL 分组。可用 COALESCE 函数统一处理：

SELECT COALESCE(status, '未知') AS status, COUNT(*) 
FROM orders 
GROUP BY status;

5.3 分组与排序的优先级

GROUP BY 的优先级高于 ORDER BY，因此分组后的排序需在 GROUP BY 后指定。

六、实战案例：电商销售数据分析

6.1 案例背景

某电商平台需分析以下数据：

各城市用户订单量
按月份统计销售额
筛选订单量超过 100 的城市

6.2 SQL 实现

-- 案例1：按城市统计订单量
SELECT city, COUNT(order_id) AS order_count
FROM orders
GROUP BY city;

-- 案例2：按月份统计销售额
SELECT 
  DATE_FORMAT(order_date, '%Y-%m') AS month,
  SUM(amount) AS monthly_sales
FROM orders
GROUP BY month
ORDER BY month;

-- 案例3：筛选订单量超过100的城市
SELECT city, COUNT(order_id) AS order_count
FROM orders
GROUP BY city
HAVING order_count > 100;

结论：掌握 GROUP BY 的关键价值

MySQL GROUP BY 语句是数据分析的核心工具，它通过将数据分组、聚合，帮助开发者从原始数据中提取关键信息。无论是统计基础指标、构建多维分析，还是优化查询性能，GROUP BY 都需要开发者结合业务场景灵活运用。

对于初学者，建议从基础语法开始，逐步尝试多字段分组和结合 HAVING/ORDER BY 的复杂查询；中级开发者则可深入探索窗口函数与性能优化技巧。通过持续实践和案例分析，GROUP BY 将成为你高效处理数据的得力助手。

掌握分组逻辑后，不妨尝试将本文案例扩展到实际项目中，例如分析用户行为数据或优化库存管理——这正是 MySQL GROUP BY 语句 的真正价值所在。

MySQL GROUP BY 语句（建议收藏）

引言：为什么需要数据分组？

一、GROUP BY 的基础语法与核心概念

1.1 基础语法结构

1.2 简单案例：统计订单总金额

二、GROUP BY 的分组规则与注意事项

2.1 “分组列必须出现在 SELECT 或聚合函数中” 规则

2.2 分组顺序与数据量影响

三、GROUP BY 与其他子句的配合使用

3.1 结合 HAVING 筛选分组结果

3.2 结合 ORDER BY 排序分组结果

3.3 结合 DISTINCT 去重分组

四、GROUP BY 的高级用法与常见场景

4.1 多字段分组：构建多维统计

4.2 窗口函数与 GROUP BY 的对比

4.3 性能优化技巧

五、GROUP BY 的常见问题与解决方案

5.1 未指定聚合函数导致的错误

5.2 空值（NULL）的处理

5.3 分组与排序的优先级

六、实战案例：电商销售数据分析

6.1 案例背景

6.2 SQL 实现

结论：掌握 GROUP BY 的关键价值

最新发布

jQuery.each()方法（长文解析）

jQuery.extend()方法（长文解析）

jQuery.fn.extend()方法（千字长文）

jQuery.globalEval()方法（长文讲解）

jQuery.grep() 方法（长文讲解）

jQuery.inArray() 方法（长文讲解）

jQuery.isArray() 方法（手把手讲解）

jQuery.isEmptyObject() 方法（千字长文）

jQuery.isFunction() 方法（建议收藏）

jQuery.isNumeric() 方法（手把手讲解）