当前位置: 首页 > news >正文

SQL关键字三分钟入门:ROW_NUMBER() —— 窗口函数为每一行编号

在进行数据分析时,我们常常需要为查询结果集中的每条记录生成一个唯一的序号或行号。例如:

  • 为每位员工按照入职时间排序并编号;
  • 按照订单金额对订单进行排序,并给每个订单分配一个顺序编号;
  • 在分组数据内为每条记录编号。

这时候就需要使用 SQL 中非常有用的窗口函数 —— ROW_NUMBER()

它可以帮助我们轻松地为查询结果集中的每一行分配一个独一无二的行号,特别适合处理涉及排序和分组的数据分析任务。


 什么是 ROW_NUMBER()?

ROW_NUMBER() 是 SQL 中用于为分区或整个结果集中的行生成唯一行号的窗口函数。它会根据指定的排序规则为每条记录分配一个连续的行号,即使存在相同的值也不会导致行号跳过。

你可以把它理解为:“按照某个标准给每条记录打上独一无二的行号标签”。


 基本语法

SELECT column1, column2, ..., 
ROW_NUMBER() OVER ([PARTITION BY partition_column]ORDER BY sort_column [ASC|DESC], ...
) AS row_num
FROM table_name;
  • PARTITION BY(可选):定义如何将数据划分为不同的分区(类似于 GROUP BY),每个分区独立进行编号。
  • ORDER BY:指定用于决定行号顺序的列及其方向(升序或降序)。

 示例讲解

假设我们有一个 employees 表,记录了员工的信息:

employee_idnamehire_date
1张三2020-06-01
2李四2019-05-23
3王五2021-07-15
4赵六2020-08-10
5孙七2018-03-12

 示例1:按入职日期为所有员工编号

SELECT name, hire_date,
ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namehire_daterow_num
孙七2018-03-121
李四2019-05-232
张三2020-06-013
赵六2020-08-104
王五2021-07-155

 注意:这里我们按入职日期进行了升序排列,并为每位员工分配了一个连续的行号。


 示例2:按部门对员工进行编号(使用 PARTITION BY)

假设我们增加了一个 department 列来表示员工所属的部门:

employee_idnamedepartmenthire_date
1张三销售部2020-06-01
2李四销售部2019-05-23
3王五技术部2021-07-15
4赵六技术部2020-08-10
5孙七销售部2018-03-12
SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namedepartmenthire_daterow_num
孙七销售部2018-03-121
李四销售部2019-05-232
张三销售部2020-06-013
王五技术部2021-07-151
赵六技术部2020-08-102

 这里我们按部门进行了划分,然后在每个部门内部根据入职日期进行编号。


 示例3:结合其他聚合函数使用

有时候你可能还需要同时计算一些汇总信息,比如总人数、平均入职年限等。下面的例子展示了如何同时显示编号和部门总人数:

SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num,
COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept
FROM employees;
结果:
namedepartmenthire_daterow_numtotal_employees_in_dept
孙七销售部2018-03-1213
李四销售部2019-05-2323
张三销售部2020-06-0133
王五技术部2021-07-1512
赵六技术部2020-08-1022

注意

对比项使用建议
唯一行号即使有相同的排序值,ROW_NUMBER() 也会为每条记录分配一个唯一的行号
不同的排名函数RANK():允许并列排名,但会导致行号跳跃
DENSE_RANK():与 RANK() 类似,但不会跳过行号
性能优化尽量减少 PARTITION BY 的范围以提高性能
数据一致性在执行复杂的编号操作时,确保数据的一致性和准确性

 总结对比表

场景SQL 示例
按单一条件编号SELECT ..., ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num FROM employees;
按部门内条件编号SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num FROM employees;
结合其他聚合函数使用SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num, COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept FROM employees;

希望这篇简短的指南帮助你快速了解了 ROW_NUMBER() 窗口函数的强大功能。

http://www.xdnf.cn/news/1073197.html

相关文章:

  • FreeSWITCH配置文件解析(2) dialplan 拨号计划中xml 的action解析
  • 西门子S7-200 SMART PLC:小型自动化领域的高效之选
  • C语言---常见的字符函数和字符串函数介绍
  • STM32[笔记]--7.MDK5调试功能
  • 关于ubuntu 20.04系统安装分区和重复登录无法加载桌面的问题解决
  • 医疗标准集中标准化存储与人工智能智能更新协同路径研究(上)
  • 基于Spring Boot的网上购物平台设计与实现
  • 最后的生还者2:重制版 免安 中文离线运行版+整合包
  • Vue 项目中 Excel 导入导出功能笔记
  • 【数据标注师】3D标注
  • 【数据标注师】事件标注2
  • kubectl get pod返回数据研究
  • 访问不了/druid/index.html (sql.html 或 login.html)
  • 在单片机中如何实现一个shell控制台
  • 权限提升-工作流
  • Go开发工程师-Golang基础知识篇
  • Element Plus el-button实例类型详解
  • Kioptrix Level1
  • TCP 在高速网络下的大数据量传输优化:拥塞控制、效率保障与协议演进​
  • 开源3D 动态银河系特效:Vue 与 THREE.JS 的奇幻之旅
  • 在项目中如何巧妙使用缓存
  • MCPA2APPT:基于 A2A+MCP+ADK 的多智能体流式并发高质量 PPT 智能生成系统
  • spring-ai 1.0.0 (2)提示词,消息构建和移植能力
  • 华为云Flexus+DeepSeek征文 | 华为云ModelArts Studio实战指南:创建高效的AingDesk知识库问答助手
  • 复杂驱动开发-TLE9471的休眠流程与定时唤醒
  • python解释器 与 pip脚本常遇到的问题汇总
  • WPF XAML 格式化工具(XAML Styler)
  • 机器学习开篇:算法分类与开发流程
  • 网络安全体系结构和安全防护
  • Bootstrap 5学习教程,从入门到精通,Bootstrap 5 Flex 布局语法知识点及案例(27)