sql中where和having区别 WHERE和HAVING筛选条件的5大不同点

where在分组前筛选行,having在分组后筛选组。1.执行时机:where先过滤行再分组,having后过滤组;2.作用对象:where针对单行数据,having针对分组结果;3.可用列:where用原始列,having用聚合列或group by列;4.语法位置:where在group by前,having在group by后;5.性能考量:优先用where减少计算量,having用于聚合条件筛选。

sql中where和having区别 WHERE和HAVING筛选条件的5大不同点

简单来说,WHERE子句在分组之前筛选行,而HAVING子句在分组之后筛选组。WHERE针对的是表中的实际数据行,HAVING针对的是GROUP BY语句分组后的结果。

sql中where和having区别 WHERE和HAVING筛选条件的5大不同点

WHERE和HAVING筛选条件的5大不同点

sql中where和having区别 WHERE和HAVING筛选条件的5大不同点

1. 执行时机:先WHERE后HAVING

这是最核心的区别。WHERE子句在数据分组之前应用,这意味着它直接作用于表中的每一行数据。想象一下,你在一个巨大的数据池里,WHERE就像一个筛子,先把不符合条件的数据行过滤掉,剩下的数据才能进入后续的分组和聚合计算。

而HAVING子句则是在数据分组和聚合之后应用。它就像是另一个筛子,但这次筛选的对象不再是原始数据行,而是GROUP BY语句产生的各个分组。只有满足HAVING条件的分组才会被保留,其他的会被丢弃。

sql中where和having区别 WHERE和HAVING筛选条件的5大不同点

举个例子,假设你有一个orders表,包含customer_id和order_amount两列。你想找出平均订单金额超过100的客户。你不能直接用WHERE子句,因为WHERE只能作用于单行数据,而平均订单金额是一个聚合值。正确的做法是先用GROUP BY按customer_id分组,然后用HAVING子句筛选平均订单金额大于100的分组:

select customer_id, AVG(order_amount) AS avg_amount FROM orders GROUP BY customer_id HAVING AVG(order_amount) > 100;

2. 作用对象:行 vs. 组

正如上面所说,WHERE子句作用于单个数据行,它根据每一行的数据来决定是否保留该行。HAVING子句作用于由GROUP BY语句创建的分组,它根据每个分组的聚合结果来决定是否保留该分组。

3. 可用列:原始列 vs. 聚合列

WHERE子句可以使用表中的任何列,只要这些列在WHERE子句的条件表达式中是有效的。但是,WHERE子句不能使用聚合函数,比如AVG(), SUM(), MAX(), MIN(), count()。因为聚合函数是在分组之后计算的,而在WHERE子句执行的时候,分组还没有发生。

HAVING子句则恰恰相反,它主要用于筛选聚合函数的结果。虽然HAVING子句也可以使用表中的原始列,但通常情况下,我们会用它来筛选聚合函数的结果。如果在HAVING子句中使用了原始列,那么这些列必须出现在GROUP BY子句中,否则会报错。

4. 语法位置:WHERE在GROUP BY之前,HAVING在GROUP BY之后

sql语句的执行顺序是固定的,WHERE子句必须出现在GROUP BY子句之前,而HAVING子句必须出现在GROUP BY子句之后。如果你把它们的顺序搞错了,SQL解释器会报错。

一个完整的SQL查询语句的结构通常是这样的:

SELECT column1, column2, ... FROM table_name WHERE condition GROUP BY column1, column2, ... HAVING condition ORDER BY column1, column2, ...

5. 性能考量:能用WHERE就不用HAVING

通常情况下,WHERE子句的性能比HAVING子句更好。因为WHERE子句在分组之前过滤数据,可以减少需要分组和聚合的数据量。而HAVING子句是在分组和聚合之后过滤数据,即使有很多数据行最终会被HAVING子句过滤掉,它们仍然需要先被分组和聚合,这会增加计算成本。

因此,如果你的筛选条件可以同时用WHERE子句和HAVING子句来实现,那么应该优先使用WHERE子句。比如,你想找出订单金额大于100的客户的平均订单金额,你可以这样写:

SELECT customer_id, AVG(order_amount) AS avg_amount FROM orders WHERE order_amount > 100 GROUP BY customer_id;

而不是这样写:

SELECT customer_id, AVG(order_amount) AS avg_amount FROM orders GROUP BY customer_id HAVING order_amount > 100; -- 错误!order_amount不是聚合函数的结果,应该用WHERE

当然,如果你的筛选条件必须基于聚合函数的结果,那么就只能使用HAVING子句了。

什么时候应该使用WHERE,什么时候应该使用HAVING?

这个问题其实上面已经说了很多,但为了更清晰地总结一下,可以这样理解:

  • 使用WHERE的情况: 当你需要基于原始数据行进行筛选,并且筛选条件不涉及任何聚合函数时,使用WHERE子句。
  • 使用HAVING的情况: 当你需要基于分组后的聚合结果进行筛选时,使用HAVING子句。

简单来说,WHERE用于过滤行,HAVING用于过滤组。记住这个原则,你就不会再混淆WHERE和HAVING了。

WHERE子句中可以使用子查询吗?

当然可以!WHERE子句中可以使用子查询,这是一种非常强大的SQL技巧。子查询可以让你在WHERE子句中使用更复杂的条件,比如根据另一个查询的结果来筛选数据。

举个例子,假设你有一个customers表和一个orders表,你想找出所有下过订单的客户。你可以使用子查询来实现:

SELECT * FROM customers WHERE customer_id IN (SELECT customer_id FROM orders);

在这个例子中,子查询SELECT customer_id FROM orders返回所有下过订单的客户的ID列表。然后,外层查询使用WHERE customer_id IN (…)来筛选出customers表中所有ID在子查询结果中的客户。

子查询还可以用于更复杂的场景,比如比较不同分组的聚合结果,或者根据动态计算的值来筛选数据。掌握子查询的用法,可以让你编写更灵活和强大的SQL查询。

HAVING子句中可以使用子查询吗?

和WHERE子句类似,HAVING子句也可以使用子查询。但是,在HAVING子句中使用子查询的情况相对较少。因为HAVING子句主要用于筛选分组后的聚合结果,而子查询通常用于获取原始数据。

不过,在某些特殊情况下,HAVING子句中使用子查询也是有用的。比如,你想找出平均订单金额高于所有客户平均订单金额的客户。你可以这样写:

SELECT customer_id, AVG(order_amount) AS avg_amount FROM orders GROUP BY customer_id HAVING AVG(order_amount) > (SELECT AVG(order_amount) FROM orders);

在这个例子中,子查询SELECT AVG(order_amount) FROM orders返回所有客户的平均订单金额。然后,HAVING子句使用AVG(order_amount) > (…)来筛选出平均订单金额高于所有客户平均订单金额的客户。

需要注意的是,在HAVING子句中使用子查询时,要确保子查询返回的结果是单个值,或者是一个可以与聚合函数进行比较的值。否则,SQL解释器会报错。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享