sql server如何利用开窗函数over()进行分组统计

作者:lijiao 时间:2024-01-16 01:55:36 

这是一道常见的面试题,在实际项目中经常会用到。

需求:求出以产品类别为分组,各个分组里价格最高的产品信息。

实现过程如下:


declare @t table(
ProductID int,
ProductName varchar(20),
ProductType varchar(20),
Price int)

--测试数据


insert @t
select 1,'name1','P1',3 union all
select 2,'name2','P1',5 union all
select 3,'name3','P2',4 union all
select 4,'name4','P2',4

--做法一:找到每个组里,价格最大的值;然后再找出每个组里价格等于这个值的
--缺点:要进行一次join


select t1.*
from @t t1
join (select ProductType,
max(Price) Price
from @t
group by ProductType) t2 on t1.ProductType = t2.ProductType
where t1.Price = t2.Price
order by ProductType

--做法二:利用over(),将统计信息计算出来,然后直接筛选结果集。
--over() 可以让函数(包括聚合函数)与行一起输出。


;with cte as(
select *, max(Price) over(partition by (ProductType)) MaxPrice
from @t)
select ProductID,ProductName,ProductType,Price from cte where Price = MaxPrice
order by ProductType

--over() 的语法为:over([patition by ] <order by >)。需要注意的是,over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。
--over() 的另一常用情景是与 row_number() 一起用于分页。

现在来介绍一下开窗函数。

窗口函数OVER()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。 

开窗函数不需要使用GROUP BY就可以对数据进行分组,还可以同时返回基础行的列和聚合列。  

1.排名开窗函数

ROW_NUMBER、DENSE_RANK、RANK、NTILE属于排名函数。

排名开窗函数可以单独使用ORDER BY 语句,也可以和PARTITION BY同时使用。

PARTITION BY用于将结果集进行分组,开窗函数应用于每一组。

ODER BY 指定排名开窗函数的顺序。在排名开窗函数中必须使用ORDER BY语句。

例如查询每个雇员的定单,并按时间排序


WITH OrderInfo AS

(

SELECT ROW_NUMBER() OVER(PARTITION BY EmployeeID ORDER BY OrderDate) AS Number,

OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK)

)

SELECT Number,OrderID,CustomerID, EmployeeID ,OrderDate

From OrderInfo WHERE Number BETWEEN 0 AND 10

窗口函数根据PARTITION BY语句按雇员ID对数据行分组,然后按照ORDER BY 语句排序,排名函数ROW_NUMBER()为每一组的数据分从1开始生成一个序号。 

ROW_NUMBER()为每一组的行按顺序生成一个唯一的序号

RANK()也为每一组的行生成一个序号,与ROW_NUMBER()不同的是如果按照ORDER BY的排序,如果有相同的值会生成相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号3,那么接下来会生成序号5。

DENSE_RANK()和RANK()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同的行生成序号3,那么接下来生成的序号还是4。

NTILE (integer_expression) 按照指定的数目将数据进行分组,并为每一组生成一个序号。

2.聚合开窗函数

很多聚合函数都可以用作窗口函数的运算,如SUM,AVG,MAX,MIN。

聚合开窗函数只能使用PARTITION BY子句或都不带任何语句,ORDER BY不能与聚合开窗函数一同使用。

例如,查询雇员的定单总数及定单信息


WITH OrderInfo AS

(

SELECT COUNT(OrderID) OVER(PARTITION BY EmployeeID) AS TotalCount,OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK)

)

SELECT OrderID,CustomerID, EmployeeID ,OrderDate,TotalCount

From OrderInfo ORDER BY EmployeeID

如果窗口函数不使用PARTITION BY 语句的话,那么就是不对数据进行分组,聚合函数计算所有的行的值。


WITH OrderInfo AS

(

SELECT COUNT(OrderID) OVER() AS Count,OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK)

)
标签:sql,server,开窗函数
0
投稿

猜你喜欢

  • Python实现输出某区间范围内全部素数的方法

    2022-04-25 10:04:50
  • Python代码块及缓存机制原理详解

    2023-07-02 08:12:07
  • asp dictionary对象的用法

    2011-04-14 11:09:00
  • apache配置虚拟主机的方法详解

    2023-06-18 09:05:29
  • 对Pytorch 中的contiguous理解说明

    2022-04-14 08:34:47
  • python 实现兔子生兔子示例

    2022-04-13 05:15:11
  • python代码区分大小写吗

    2023-11-26 11:23:46
  • Python动态演示旋转矩阵的作用详解

    2022-08-21 02:35:15
  • python 性能提升的几种方法

    2022-05-21 06:38:18
  • java正则表达式应用的实例代码

    2022-09-15 20:56:48
  • python 中赋值,深拷贝,浅拷贝的区别

    2022-11-15 09:35:44
  • 教你用scrapy框架爬取豆瓣读书Top250的书类信息

    2022-11-04 12:48:23
  • perl哈希hash的常见用法介绍

    2023-08-12 18:46:59
  • Python进度条的制作代码实例

    2022-01-01 23:17:34
  • mysql 5.7.19 winx64免安装版配置教程

    2024-01-14 00:27:36
  • 以大热剧《觉醒年代》为例用Python绘制可视化仪表盘

    2022-03-23 15:27:07
  • 使用PyQtGraph绘制精美的股票行情K线图的示例代码

    2023-12-05 11:58:21
  • SQL中JOIN和UNION区别、用法及示例介绍

    2012-08-21 10:47:22
  • python实现简单ftp客户端的方法

    2023-12-14 20:07:31
  • pytorch 实现在预训练模型的 input上增减通道

    2023-12-02 00:49:33
  • asp之家 网络编程 m.aspxhome.com