PostgreSQL rank() 函数使用指南

PostgreSQL rank() 函数返回当前行所在的分区内的排名,从 1 开始,但有间隔。

也就是说,相同的值具有相同的排名,但是下一个不同的值的排名采用 row_number() 编号。比如,如果有 2 个第一名,那么第三位的排名是 3。这与 dense_rank() 函数是不同的。

rank() 语法

这里是 PostgreSQL rank() 函数的语法:

rank()
OVER (
  [PARTITION BY partition_column_list]
  [ORDER BY order_column_list]
)

参数

partition_column_list
参与分区的列的列表。
order_column_list
参与排序的列的列表。

返回值

PostgreSQL rank() 函数返回当前行所在的分区内的排名,从 1 开始,但有间隔。

rank() 示例

演示数据准备

使用下面的 CREATE TABLE 语句创建一个表 student_grade 以存储学生的班级和成绩:

CREATE TABLE student_grade (
  id SERIAL PRIMARY KEY,
  name VARCHAR(50) NOT NULL,
  class CHAR(1) NOT NULL,
  subject VARCHAR(20) NOT NULL,
  grade INT NOT NULL
);

这里创建了一个 student_grade 表,它有 5 个列:

  • id - 行 ID,主键。
  • name - 学生的姓名。
  • class - 学生所在的班级。
  • subject - 科目的名称。
  • grade - 该科目的成绩。

使用下面的 INSERT 语句向 student_grade 表中插入一些行

INSERT INTO student_grade
  (name, class, subject, grade)
VALUES
  ('Tim', 'A', 'Math', 9),
  ('Tom', 'A', 'Math', 7),
  ('Jim', 'A', 'Math', 8),
  ('Tim', 'A', 'English', 7),
  ('Tom', 'A', 'English', 8),
  ('Jim', 'A', 'English', 7),
  ('Lucy', 'B', 'Math', 8),
  ('Jody', 'B', 'Math', 6),
  ('Susy', 'B', 'Math', 9),
  ('Lucy', 'B', 'English', 6),
  ('Jody', 'B', 'English', 7),
  ('Susy', 'B', 'English', 8);

使用下面的 SELECT 语句检索表中的数据:

SELECT * FROM student_grade;
 id | name | class | subject | grade
----+------+-------+---------+-------
  1 | Tim  | A     | Math    |     9
  2 | Tom  | A     | Math    |     7
  3 | Jim  | A     | Math    |     8
  4 | Tim  | A     | English |     7
  5 | Tom  | A     | English |     8
  6 | Jim  | A     | English |     7
  7 | Lucy | B     | Math    |     8
  8 | Jody | B     | Math    |     6
  9 | Susy | B     | Math    |     9
 10 | Lucy | B     | English |     6
 11 | Jody | B     | English |     7
 12 | Susy | B     | English |     8
(12 rows)

按照科目查看每个学生的成绩排名

要查看在每个科目中每个学生按照成绩从高到低的排名,请使用如下语句:

SELECT *,
  rank() OVER (
    PARTITION BY subject
    ORDER BY grade DESC
  ),
  dense_rank() OVER (
    PARTITION BY subject
    ORDER BY grade DESC
  )
FROM student_grade;
 id | name | class | subject | grade | rank | dense_rank
----+------+-------+---------+-------+------+------------
 12 | Susy | B     | English |     8 |    1 |          1
  5 | Tom  | A     | English |     8 |    1 |          1
 11 | Jody | B     | English |     7 |    3 |          2
  4 | Tim  | A     | English |     7 |    3 |          2
  6 | Jim  | A     | English |     7 |    3 |          2
 10 | Lucy | B     | English |     6 |    6 |          3
  1 | Tim  | A     | Math    |     9 |    1 |          1
  9 | Susy | B     | Math    |     9 |    1 |          1
  7 | Lucy | B     | Math    |     8 |    3 |          2
  3 | Jim  | A     | Math    |     8 |    3 |          2
  2 | Tom  | A     | Math    |     7 |    5 |          3
  8 | Jody | B     | Math    |     6 |    6 |          4
(12 rows)

注意,上面 SQL 语句中的窗口函数:

rank() OVER (
  PARTITION BY subject
  ORDER BY grade DESC
)

OVER 子句中,

  • PARTITION BY subject 将按照学科进行分区
  • ORDER BY grade DESC 将每个分区内的行按照成绩逆序排列。
  • rank() 返回每行在其关联的分区内的排名。

您从上面也可以看出 rank()dense_rank() 的不同。

按照班级查看每个学生的总成绩排名

要查看在每个班级中每个学生按照总成绩从高到底的排名,请使用下面的语句:

SELECT t.*,
  rank() OVER (
    PARTITION BY class
    ORDER BY t.sum_grade DESC
  )
FROM (
    SELECT class,
      name,
      sum(grade) sum_grade
    FROM student_grade
    GROUP BY class, name
  ) t;
 class | name | sum_grade | rank
-------+------+-----------+------
 A     | Tim  |        16 |    1
 A     | Jim  |        15 |    2
 A     | Tom  |        15 |    2
 B     | Susy |        17 |    1
 B     | Lucy |        14 |    2
 B     | Jody |        13 |    3
(6 rows)

在上面的语句中,注意这个子查询

SELECT class,
  name,
  sum(grade) sum_grade
FROM student_grade
GROUP BY class, name

这个子查询使用 GROUP BY 子句和 sum() 按照班级和学生汇总出每个学生的总成绩。

 class | name | sum_grade
-------+------+-----------
 A     | Tim  |        16
 A     | Jim  |        15
 A     | Tom  |        15
 B     | Jody |        13
 B     | Lucy |        14
 B     | Susy |        17
(6 rows)

主语句在从这个子查询中按照班级进行分区,然后在每个分区内按照总成绩逆序排序,并使用 rank() 返回每行在其关联的分区内的排名。