程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> SQL Server數據匯總五招輕松搞定

SQL Server數據匯總五招輕松搞定

編輯:關於SqlServer

本文我們將討論如何使用GROUPBY子句來匯總數據。

使用單獨列分組

GROUP BY子句通過設置分組條件來匯總數據,在第一個例子中,我在數據庫AdventureWork2012中的表 Sales.SalesOrderDetail.中的一列上進行數據分組操作。這個例子以及其他例子都使用數據庫AdventureWorks2012,如果你想使用它運行我的代碼,你可以點擊下載。

下面是第一個示例的源碼,在CarrierTrackingNumber列上使用group by子句進行數據分組操作

USE AdventureWorks2012; 
 
GO 
 
SELECT CarrierTrackingNumber 
 
,SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail 
 
GROUP BY CarrierTrackingNumber; 

在我運行這段代碼後,會得到3807個記錄,下面是這個龐大的結果集中前五個數值:

CarrierTrackingNumber LineTotal 
 
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 
 
6E46-440A-B5 2133.170700 
 
B501-448E-96 4085.409800 
 
8551-4CDF-A1 72616.524200 
 
B65C-4867-86 714.704300 
 
99CE-4ADA-B1 16185.429200 

在上面的示例中,我使用group by子句選擇哪些列作為聚集dventureWorks2012.Sales.SalesOrderDetai數據表數據的條件,在例子中,我使用CarrierTrackingNumber匯總數據,當你進行數據分組時,只有在group By 子句中出現的列才在selection 列表中有效。在我的示例中,我使用聚集函數SUM計算LineTotal,為了使用方便,我為它設置了別名SummarizedLineTotal。

如果我想獲得CarrierTrackingNumber 滿足特定條件下的聚集集合,那我可以在Where子句中對查詢進行限制,就像我下面做的這樣:

USE AdventureWorks2012; 
 
GO 
 
SELECT CarrierTrackingNumber 
 
,SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail 
 
WHERE CarrierTrackingNumber = '48F2-4141-9A' 
 
GROUP BY CarrierTrackingNumber; 

這裡我在原始查詢基礎上在where子句中加上了一條限制,我設置了我的查詢只返回CarrierTrackingNumber 等於一個特定值的結果。運行這段代碼後,我會得到記錄中CarrierTrackingNumber 等於48F2-4141-9A的行的數量。Where子句的過濾行為在數據被聚集之前就已生效。

通過多列來分組

有時候你可能需要使用多列來進行數據分組,下面是我使用多列進行分組的示例代碼

SELECT D.ProductID 
 
, H.OrderDate 
 
, SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail D 
 
JOIN AdventureWorks2012.Sales.SalesOrderHeader H 
 
ON D.SalesOrderId = H.SalesOrderID 
 
GROUP BY ProductID, OrderDate; 

查詢返回26878行數據,這是上面查詢返回的部分結果:

ProductID OrderDate LineTotal 
 
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 
 
714 2008-05-21 00:00:00.000 99.980000 
 
859 2007-11-03 00:00:00.000 48.980000 
 
923 2007-11-23 00:00:00.000 14.970000 
 
712 2007-12-22 00:00:00.000 62.930000 
 
795 2007-10-14 00:00:00.000 2443.350000 
 
950 2007-07-01 00:00:00.000 2462.304000 
 
795 2007-11-06 00:00:00.000 2443.350000 
 
877 2007-11-19 00:00:00.000 15.900000 
 
713 2007-10-01 00:00:00.000 99.980000 
 
860 2008-05-31 00:00:00.000 48.980000 
 
961 2008-05-01 00:00:00.000 36242.120880 

在上面的示例程序中,Group by 子句中用到了ProductID列與OrderDate列,SQL Server基於ProductID和OrderDate二者組合的唯一性,返回LineTotal的值,並為其設置別名SummarizedLineTotal。如果你查看程序的輸出,你會發現SQL Server 對數據進行分組後,返回的結果並沒有特定的順序,如果你需要返回結果按照一定順序排序,你需要使用ORDER BY 子句,就像我在下面代碼中展示的那樣。

SELECT D.ProductID 
 
, H.OrderDate 
 
, SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail D 
 
JOIN AdventureWorks2012.Sales.SalesOrderHeader H 
 
ON D.SalesOrderId = H.SalesOrderID 
 
GROUP BY ProductID, OrderDate 
 
ORDER BY SummarizedLineTotal DESC; 

在上面的代碼中,我按照SummorizedLineTotal降序對結果集進行排序,此列的值通過Group BY子句分組後對LineTotal使用聚合函數Sum得到。我對結果按照SummorizedLineTotal 的值降序排列。如果你運行此程序,你可以得出LineTotal 數量最高的ProductID和OrderDate。

對沒有任何值的數據進行分組

有時候你會需要對一些記錄中包含空值的數據進行分組操作。當你在SQL Server 執行此類操作時,它會自動假設所有NULL值相等。讓我看一下下面的示例程序

CREATE TABLE NullGroupBy (OrderDate date, Amount Int); 
 
INSERT INTO NullGroupBy values (NULL,100), 
 
('10-30-2014',100), 
 
('10-31-2014',100), 
 
(NULL,100); 
 
SELECT OrderDate, SUM(Amount) as TotalAmount 
 
FROM NullGroupBy 
 
GROUP BY OrderDate; 
 
DROP TABLE NullGroupBy; 
 
When I run this code I get the following output: 
 
OrderDate TotalAmount 
 
-- -- -- -- -- -- -- -- -- -- - 
 
NULL 200 
 
2014-10-30 100 
 
2014-10-31 100 

在上面的程序中,我首先創建並填充了一個NullGroupBy表.在這個表中,我放置了四個不同的行,第一行和最後一行的orderDate列值為NULL,其他兩列的orderDate值不同。從上面的輸出結果可以看到,SQL Server 在分組時將OrderDate為NULL的兩行聚集為一行處理。

在Group BY 子句中使用表達式

有時你需要在Group by子句中使用表達式,而不是具體的列。SQL Server允許你在Group By子句中指定一個表達式,就像下面的代碼中所示:

SELECT CONVERT(CHAR(7),H.OrderDate,120) AS [YYYY-MM] 
 
, SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail D 
 
JOIN AdventureWorks2012.Sales.SalesOrderHeader H 
 
ON D.SalesOrderId = H.SalesOrderID 
 
GROUP BY CONVERT(CHAR(7),H.OrderDate,120) 
 
ORDER BY SummarizedLineTotal DESC; 

上述代碼使用OrderDate 列中的年月數據進行分組,通過使用表達式CONVERT(CHAR(7),H.OrderDate,120) ,我告訴SQL服務器截取OrderDate ODBC標准日期格式的前七個字符,也就是OrderDate yyyy-mm部分。基於這個表達式,我可以找出特定年月的total SummarizeLineTotal值,在Group By子句中使用表達式,以及對LineTotal值排序,我可以找出哪一年哪一個月的SummarizeLineTotal最大或最小。

使用HAVING子句過濾數據

Having 是另外一個能與Group BY 子句結合使用的重要子句,使用Having 子句,你可以過濾掉不符合Having子句所接表達式的數據行,當我在其上使用where子句時,在聚集之前就會產生過濾行為。Having 子句允許你基於某些標准過濾聚合行。想要更清楚地了解Having子句,請參考下面代碼:

SELECT D.ProductID 
 
, H.OrderDate 
 
, SUM(LineTotal) AS SummarizedLineTotal 
 
FROM AdventureWorks2012.Sales.SalesOrderDetail D 
 
JOIN AdventureWorks2012.Sales.SalesOrderHeader H 
 
ON D.SalesOrderId = H.SalesOrderID 
 
GROUP BY ProductID, OrderDate 
 
HAVING SUM(LineTotal) > 200000 
 
ORDER BY SummarizedLineTotal DESC; 

在上面的代碼中Having子句限制條件是SUM(LineTotal) > 200000。這個having子句保證最終結果中LineTotal的聚合值(SummarizedLineTotal)大於200000.通過使用having子句,我的查詢只返回一行數據,其SummarizedLineTotal大於200000.having子句允許SQL Server 只返回聚合結果滿足Having子句限制的條件的數據行。

總結

許多應用要求數據在展示之前要經過一定的匯總操作,GROUP BY子句就是SQL Server提供的匯總數據的機制。GROUPBY子句允許你使用HAVING子句對匯總數據進行特定的過濾。希望下次你需要匯總一些數據的時候,你可以更加容易的達到目的。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved