在本教程中,您将学习如何使用sql group by子句根据一列或多列对行进行分组。
分组是使用数据库时必须处理的最重要任务之一。 要将行分组,请使用group by子句。
group by子句是select语句的可选子句,它根据指定列中的匹配值将行组合成组,每组返回一行。
经常将group by与min,max,avg,sum或count等聚合函数结合使用,以计算为每个分组提供信息的度量。
以下是group by子句的语法。
select
column1,
column2,
aggregate_function (column3)
from
table1
group by
column1,
column2;
在select子句中包含聚合函数不是强制性的。 但是,如果使用聚合函数,它将计算每个组的汇总值。
如果要在分组之前过滤行,请添加where子句。 但是要过滤组,请使用having子句。
需要强调的是,在对行进行分组之前应用where子句,而在对行进行分组之后应用having子句。 换句话说,where子句应用于行,而having子句应用于分组。
要对组进行排序,请在group by子句后添加order by子句。
group by子句中出现的列称为分组列。 如果分组列包含null值,则所有null值都汇总到一个分组中,因为group by子句认为null值相等。
我们将使用示例数据库中的employees和departments表来演示group by子句的工作方式。
要查找每个部门的员工数量,请按department_id列对员工进行分组,并将count函数应用于每个组,如下所示:
select
department_id,
count(employee_id) headcount
from
employees
group by
department_id;
执行上面查询语句,得到以下结果:
2.1. sql group by带有inner join示例
要获取部门名称,请使用departments表将employees表连接,如下所示:
select
e.department_id,
department_name,
count(employee_id) headcount
from
employees e
inner join departments d on d.department_id = e.department_id
group by
e.department_id;
执行上面查询语句,得到以下结果:
2.2. sql group by带有order by示例
要按人数排序部门,请添加order by子句作为以下语句:
select
e.department_id,
department_name,
count(employee_id) headcount
from
employees e
inner join
departments d on d.department_id = e.department_id
group by e.department_id
order by headcount desc;
执行上面查询语句,得到以下结果:
注意,可以在order by子句中使用headcount别名或count(employee_id)。
2.3. sql group by有having示例
要查找人数大于5的部门,请使用having子句,如下查询语句:
select
e.department_id,
department_name,
count(employee_id) headcount
from
employees e
inner join
departments d on d.department_id = e.department_id
group by e.department_id
having headcount > 5
order by headcount desc;
执行上面查询语句,得到以下结果:
+---------------+-----------------+-----------+
| department_id | department_name | headcount |
+---------------+-----------------+-----------+
| 5 | 运输 | 7 |
| 3 | 采购 | 6 |
| 10 | 财务 | 6 |
| 8 | 销售 | 6 |
+---------------+-----------------+-----------+
4 rows in set
2.4. sql group by与min,max和avg示例
以下查询返回每个部门中员工的最低,最高和平均工资。
select
e.department_id,
department_name,
min(salary) min_salary,
max(salary) max_salary,
round(avg(salary), 2) average_salary
from
employees e
inner join
departments d on d.department_id = e.department_id
group by e.department_id;
执行上面示例代码,得到以下结果:
2.5. sql group by带有sum函数示例
要获得每个部门的总薪水,请将sum函数应用于salary列,并通过department_id列分组员工,如下所示:
select
e.department_id,
department_name,
sum(salary) total_salary
from
employees e
inner join
departments d on d.department_id = e.department_id
group by e.department_id;
执行上面查询语句,得到以下结果:
+---------------+-----------------+--------------+
| department_id | department_name | total_salary |
+---------------+-----------------+--------------+
| 1 | 管理 | 4400.00 |
| 2 | 市场营销 | 19000.00 |
| 3 | 采购 | 24900.00 |
| 4 | 人力资源 | 6500.00 |
| 5 | 运输 | 41200.00 |
| 6 | it | 28800.00 |
| 7 | 公共关系 | 10000.00 |
| 8 | 销售 | 57700.00 |
| 9 | 行政人员 | 58000.00 |
| 10 | 财务 | 51600.00 |
| 11 | 会计 | 20300.00 |
+---------------+-----------------+--------------+
11 rows in set
2.6. sql group by多列
到目前为止,您已经看到将所有员工分组为一列。 例如,以下子句 -
group by department_id
将所有具有相同值的行放在一个组的department_id列中。如何按department_id和job_id列中的值对员工进行分组?
group by department_id, job_id
此子句将在一个组的department_id和job_id列中为所有具有相同值的员工进行分组。
以下语句将同一组中department_id和job_id列中具有相同值的行分组,然后返回每个组的行。
select
e.department_id,
department_name,
e.job_id,
job_title,
count(employee_id)
from
employees e
inner join
departments d on d.department_id = e.department_id
inner join
jobs j on j.job_id = e.job_id
group by e.department_id , e.job_id;
执行上面示例代码,得到以下结果:
第2,3和5部门不止一个。
这是因为这些部门的员工有不同的工作。 例如,在运输部门,有2名员工在运输业务员工作,1名员工在库存员工作,4名员工在库存管理员工作。
2.7. sql group by和distinct
如果使用group by子句而不使用聚合函数,则group by子句的行为类似于distinct运算符。
以下内容获取员工的电话号码,并按电话号码分组。
select
phone_number
from
employees
group by
phone_number;
注意,电话号码已排序。
以下语句还检索电话号码,但不使用group by子句,而是使用distinct运算符。
elect distinct
phone_number
from
employees;
结果集是相同的,只是distinct运算符返回的结果集没有排序。
在本教程中,我们向您展示了如何使用group by子句将行汇总到分组中,并将聚合函数应用于每个分组。