sql 中 union vs union all 用法_sql 中 union 与 union all 的选择指南

union 会去重,适合需要合并结果且无重复行的场景,如合并不同地区订单数据时去除重复订单;union all 不去重,适合直接合并所有记录的场景,如合并日志数据保留所有访问记录;使用时需确保各查询字段数量和类型一致,列名以第一个 select 为准,排序操作只能在最后添加。

sql 中 union vs union all 用法_sql 中 union 与 union all 的选择指南

sql 查询中,UNION 和 UNION ALL 都是用来合并多个查询结果的操作符,但它们之间有一个关键区别:UNION 会自动去重,而 UNION ALL 不做去重处理。这意味着在使用场景和性能表现上,两者有明显差异。

sql 中 union vs union all 用法_sql 中 union 与 union all 的选择指南


什么时候用 UNION

当你需要合并两个或多个 SELECT 查询的结果,并且希望最终结果中没有重复行时,应该使用 UNION。

举个例子,如果你有两个表分别记录了不同地区的销售数据,而且可能存在相同的订单编号,你只想看到所有不重复的订单列表,这时候就适合用 UNION:

sql 中 union vs union all 用法_sql 中 union 与 union all 的选择指南

SELECT order_id FROM sales_east UNION SELECT order_id FROM sales_west;

这样就能得到一个干净、无重复的订单 ID 列表。

注意:UNION 的去重操作是通过排序来实现的,这会带来额外的性能开销,尤其是在大数据量下。


什么时候用 UNION ALL

如果你不需要去重,只是想把多个查询结果简单地拼在一起,那就要用 UNION ALL。

比如你想统计每天的访问日志,即使某些天的数据结构完全一样,你也想保留所有记录,这时就应该使用 UNION ALL:

SELECT * FROM log_20240301 UNION ALL SELECT * FROM log_20240302;

这种写法比 UNION 更快,因为它不会执行排序和去重操作。

小贴士:

  • 如果你知道数据本身就不会重复,用 UNION ALL 更高效。
  • 在性能敏感的场景(如报表、批量处理)中优先考虑 UNION ALL。

使用时需要注意的地方

  • 字段数量和类型要匹配:无论是 UNION 还是 UNION ALL,合并的多个 SELECT 语句返回的列数和数据类型必须一致,否则会报错。
  • 列名以第一个 SELECT 为准:合并后的结果集列名通常取自第一个查询中的列名。
  • 排序只能加在最后:如果你想对整个结果集排序,ORDER BY 只能放在最后一个 SELECT 后面,不能每个 SELECT 都加。

基本上就这些。掌握好这两个操作符的区别和适用场景,写查询的时候才能更高效、准确。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享