sum() over(order by …) 是 sql 窗口函数,用于按指定列排序后逐行累加前面所有行的值。1. 它默认从第一行累加到当前行,适合累计求和场景,如计算每日销售额总和;2. 通过 rows between 可自定义窗口范围,例如仅累加前两行或计算移动平均;3. 使用时需注意明确排序字段、避免非唯一排序、考虑分区字段影响。正确使用可提升报表分析效率与性能。
在 SQL 中,SUM() OVER() 是一个窗口函数,常用于对数据进行累计计算。而当你加上 ORDER BY 子句时,它的作用就变成了“按序累加”,也就是我们常说的累计求和。
什么是 SUM() OVER(ORDER BY …)
简单来说,这个表达式的作用是:
按照指定字段排序后,逐行累加前面所有行(包括当前行)的值。
比如你有一张销售记录表,想看每天销售额的累计总和,就可以用它来实现。
语法结构如下:
SUM(column_name) OVER (ORDER BY order_column [ASC|DESC] ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
- column_name:要累加的列
- order_column:排序依据的列
- ROWS BETWEEN …:定义窗口范围,这里是默认的从第一行到当前行
实际使用场景举例
假设你有这样一张销售表 sales:
date | amount |
---|---|
2024-01-01 | 100 |
2024-01-02 | 200 |
2024-01-03 | 150 |
你想看到的是每天的累计销售额:
date | amount | total_so_far |
---|---|---|
2024-01-01 | 100 | 100 |
2024-01-02 | 200 | 300 |
2024-01-03 | 150 | 450 |
SQL 查询可以这样写:
SELECT date, amount, SUM(amount) OVER (ORDER BY date) AS total_so_far FROM sales;
这样就能轻松得到“按日期顺序”的累计金额了。
窗口范围控制细节
虽然默认情况下是“从第一行加到当前行”,但你可以通过 ROWS BETWEEN 明确指定窗口范围,比如:
-
只加前两行 + 当前行:
ROWS BETWEEN 2 PRECEDING AND CURRENT ROW
-
加到当前行的前一行:
ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING
这些控制方式适用于更复杂的累计需求,比如移动平均、滑动窗口统计等。
常见组合如下:
- ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW:默认行为,从头加到当前行
- ROWS BETWEEN 1 PRECEDING AND CURRENT ROW:只加前一行和当前行
- ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING:从当前行加到末尾,适合反向统计
注意事项与易错点
-
排序字段必须明确
- 如果不写 ORDER BY,那 SUM() OVER() 就只是整列总和重复显示。
- 只有加上 ORDER BY 才能形成“逐步累加”的效果。
-
避免使用非唯一排序字段
- 如果排序字段有重复值,数据库可能会以不确定的方式处理它们的顺序,导致结果不稳定。
- 建议加上第二个排序字段做辅助,比如 (ORDER BY date, id)。
-
分区字段的影响
- 如果你还用了 PARTITION BY,记得它是先分组再排序累加的。
- 比如按地区分区后,每个地区的数据会单独做累加。
基本上就这些。用好 SUM() OVER(ORDER BY …),可以在报表分析、趋势展示中节省大量代码,而且性能也比子查询更好。关键是要理解窗口函数的执行逻辑,尤其是排序和窗口范围这两个部分。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END