ROW_NUMBER函数用于为结果集每行分配唯一连续序号,从1开始递增,需配合OVER子句使用;必须包含ORDER BY以确定排序顺序,可选PARTITION BY实现分组内独立编号;常用于排序、分页、去重及获取Top N记录等场景。
ROW_NUMBER函数用于为查询结果集中的每一行分配一个唯一的连续序号,从1开始递增。这个函数属于窗口函数(Window Function),常用于排序、分页、去重等场景。
ROW_NUMBER函数的基本语法
ROW_NUMBER() OVER ([PARTITION BY 列名] ORDER BY 列名)
说明:
- ORDER BY 是必需的,决定行号分配的顺序。
- PARTITION BY 是可选的,用于将数据分组,每组独立编号。
- 没有PARTITION BY时,整个结果集按ORDER BY排序后统一编号。
按指定顺序分配行号
如果只需要对全部记录按某一列排序后编号,直接使用ORDER BY即可。
例如:给员工表按工资从高到低排序并编号
SELECT 姓名, 工资,
ROW_NUMBER() OVER (ORDER BY 工资 DESC) AS 行号
FROM 员工表;
结果中工资最高的员工行号为1,依次递增。
分组后在每组内部分配行号
使用PARTITION BY可实现“分组内排序编号”,每组都从1开始重新计数。
例如:每个部门内按工资高低分别编号
SELECT 部门, 姓名, 工资,
ROW_NUMBER() OVER (PARTITION BY 部门 ORDER BY 工资 DESC) AS 组内排名
FROM 员工表;
这样每个部门的最高工资者都会获得行号1,互不影响。
常见用途示例
ROW_NUMBER常用于以下场景:
- 分页查询:先编号再筛选行号范围,如取第6-10条数据。
- 去重处理:对重复记录分组编号,保留行号为1的记录。
- 获取 Top N 记录:结合WHERE筛选行号小于等于N的数据。
例如去重:保留每个用户最近一次登录记录
WITH RankedLog AS (
SELECT 用户ID, 登录时间,
ROW_NUMBER() OVER (PARTITION BY 用户ID ORDER BY 登录时间 DESC) AS rn
FROM 登录记录表
)
SELECT 用户ID, 登录时间
FROM RankedLog
WHERE rn = 1;
基本上就这些。掌握ORDER BY和PARTITION BY的配合使用,就能灵活控制行号分配方式。注意它生成的是动态序号,不受原始数据影响,每次执行基于当前结果排序。不复杂但容易忽略细节,比如ORDER BY缺失会导致语法错误。