sql时间序列统计需完成四步:对齐时间粒度、补全缺失时间点、明确定义业务窗口、聚合时添加上下文指标;缺一不可,否则易致漏数、断趋势、同比错误。

SQL 时间序列统计不是简单加个 GROUP BY time 就完事——核心在于“对齐时间粒度、补全缺失点、定义业务窗口、聚合有逻辑”。跳过这四步,结果往往漏数据、断趋势、算错同比,报表一上线就被业务打回来。
一、先对齐时间粒度:别让原始时间戳直接参与分组
数据库 里存的可能是精确到毫秒的created_at,但你要看的是“每天新增用户数”,那就不能GROUP BY created_at——会分出成千上万个组。必须用日期函数把它“压平”到目标粒度:
- 按天:用
date(created_at)(mysql/postgresql)或CAST(created_at AS DATE)(SQL Server) - 按小时:用
DATE_TRUNC('hour', created_at)(PostgreSQL)或DATE_FORMAT(created_at, '%Y-%m-%d %H:00:00')(MySQL) - 注意时区!统一转为业务所在时区再截取,比如
CONVERT_TZ(created_at, '+00:00', '+08:00')
二、再补全时间断点:空值不等于零,要主动填充
某天没订单,数据库里就根本没这条记录。如果只查有数据的日期,折线图就会“跳坑”。得自己造一个连续的时间维度,再左连接业务表:
- 生成连续日期:用 递归CTE(PostgreSQL/SQL Server)或日历表(推荐长期复用)
- 示例(PostgreSQL):WITH date_series AS (select generate_series(‘2024-01-01’::date, ‘2024-01-31’::date, ‘1 day’)::date AS dt)
- 再
LEFT JOIN你的订单表,用COALESCE(count(*), 0)把空行填成 0
三、明确定义统计窗口:滚动、同期、累计?差一天结果就不同
“近 7 天销售额”是滚动窗口(每天往前推 7 天),而“Q1 销售额”是固定区间(1 月 1 日–3 月 31 日)。写 SQL 前必须确认业务口径:
- 滚动 7 天:用
WHERE event_date BETWEEN CURRENT_DATE - INTERVAL '6 days' AND CURRENT_DATE - 同比(Year-on-Year):需关联去年同周期,如
ON t1.dt = t2.dt + INTERVAL '1 year' - 累计至今:用窗口函数
SUM(amount) OVER (ORDER BY dt ROWS UNBOUNDED PRECEDING)
四、聚合要带上下文:单看总数没意义,得配比率、变化率、分位数
时间序列分析的价值不在“今天卖了 100 万”,而在“比昨天涨了 12%、环比跌 5%、在近 30 天里排第 8 高”。所以聚合后通常要追加计算列:
- 环比:用
LAG(total_sales) OVER (ORDER BY dt)取上期值,再算差值和比率 - 移动平均:如
AVG(total_sales) OVER (ORDER BY dt ROWS BETWEEN 6 PRECEDING AND CURRENT ROW)(7 日均值) - 分位水平:比如
PERCENT_RANK() OVER (ORDER BY total_sales)看当天业绩在历史中的相对位置
基本上就这些。时间序列统计不是语法难题,而是业务理解 + 数据对齐 + 逻辑闭环的组合动作。把粒度、断点、窗口、衍生指标四层想清楚,SQL 自然就稳了。