having和where的区别在于作用时机和场景:1.where在分组前筛选行,用于过滤原始数据,如筛选工资>5000的员工;2.having在分组后筛选结果,用于过滤聚合结果,如保留员工数>5的部门;3.两者可同时使用,如先筛选工资>5000的员工,再保留平均工资>8000的部门;4.不能在where中使用聚合函数,因为其逐行判断,而聚合计算需基于一组行。
在 mysql 查询中,HAVING 和 WHERE 看起来都能用来筛选数据,但它们的作用时机和适用场景完全不同。简单来说:WHERE 是在分组前筛选行,而 HAVING 是在分组后筛选结果。
一、WHERE:用于过滤原始数据行
WHERE 子句是在执行 GROUP BY 之前起作用的,它用来限制从表中检索出来的原始数据行。
举个例子:
select department, count(*) AS num_employees FROM employees WHERE salary > 5000 GROUP BY department;
这段语句的意思是:先找出工资大于 5000 的员工记录,然后再按部门进行统计。也就是说,WHERE 只处理那些满足条件的数据行,不会把不符合条件的行包含进来。
适用场景:
- 在做聚合操作之前,先过滤掉不需要参与计算的数据。
- 比如你想统计“年龄大于30岁的用户”,那就应该用 WHERE age > 30。
二、HAVING:用于过滤分组后的结果
HAVING 是在 GROUP BY 完成之后才起作用的,它主要是用来筛选由 GROUP BY 产生的分组结果。
来看一个例子:
SELECT department, COUNT(*) AS num_employees FROM employees GROUP BY department HAVING COUNT(*) > 5;
这个查询的意思是:先按部门分组,然后只保留员工数超过 5 人的部门。
注意:你不能在这里使用 WHERE COUNT(*) > 5,因为 WHERE 不认识聚合函数。
适用场景:
- 当你需要根据聚合结果(比如 COUNT, SUM, AVG)来过滤分组时。
- 比如“找出订单总金额超过1万的客户”,这时候就得用 HAVING SUM(order_amount) > 10000。
三、WHERE 和 HAVING 能一起用吗?
当然可以!你可以同时使用 WHERE 和 HAVING 来完成更复杂的筛选任务。
例如:
SELECT department, AVG(salary) AS avg_salary FROM employees WHERE salary > 5000 GROUP BY department HAVING AVG(salary) > 8000;
这里做了两步筛选:
- 先选出工资高于 5000 的员工;
- 再对这些员工按部门分组,并保留平均工资高于 8000 的部门。
这种组合方式非常常见,尤其在数据分析类查询中。
四、什么时候容易混淆?
最容易搞混的是:为什么不能在 WHERE 中使用聚合函数?其实原因很简单:WHERE 是逐行判断的,而聚合函数是基于一组行计算出一个值,这在单条记录上是无法完成的。
所以记住一句话:聚合字段只能出现在 SELECT 和 HAVING 中,不能出现在 WHERE 中。
基本上就这些了。理解 WHERE 和 HAVING 的区别,关键在于它们在 SQL 执行流程中的位置不同。写查询的时候,先想清楚你是要“先筛再分组”还是“分组后再筛”,就能正确选择用了。