程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> 關於MYSQL數據庫 >> MySQL中無GROUP BY情況下直接使用HAVING語句的問題探究

MySQL中無GROUP BY情況下直接使用HAVING語句的問題探究

編輯:關於MYSQL數據庫

今天有同學給我反應,有一張表,id是主鍵,這樣的寫法可以返回一條記錄:

  “SELECT * FROM t HAVING id=MIN(id);”

   但是只是把MIN換成MAX,這樣返回就是空了:

  “SELECT * FROM t HAVING id=MAX(id);”

   這是為什麼呢?

   我們先來做個試驗,驗證這種情況。

   這是表結構,初始化兩條記錄,然後試驗:

root@localhost : plx 10:25:10> show create table t2G
*************************** 1. row ***************************
    Table: t2
Create Table: CREATE TABLE `t2` (
 `a` int(11) DEFAULT NULL,
 `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8
 
root@localhost : plx 10:25:15> select * from t2;
+------+----+
| a  | id |
+------+----+
|  1 | 1 |
|  1 | 3 |
+------+----+
2 rows in set (0.00 sec)
 
root@localhost : plx 10:25:20> SELECT * FROM t2 HAVING id=MIN(id);
+------+----+
| a  | id |
+------+----+
|  1 | 1 |
+------+----+
1 row in set (0.00 sec)
 
root@localhost : plx 10:25:30> SELECT * FROM t2 HAVING id=MAX(id);
Empty set (0.00 sec)

   初看之下,好像真的是這樣哎,怎麼會這樣呢?

   我再試一下,把a字段改一個為10,然後試下a字段:

root@localhost : plx 10:26:58> select * from t2;
+------+----+
| a  | id |
+------+----+
|  10 | 1 |
|  1 | 3 |
+------+----+
2 rows in set (0.00 sec)
 
root@localhost : plx 10:28:20> SELECT * FROM t2 HAVING a=MAX(a);
+------+----+
| a  | id |
+------+----+
|  10 | 1 |
+------+----+
1 row in set (0.00 sec)
 
root@localhost : plx 10:28:28> SELECT * FROM t2 HAVING a=MIN(a);
Empty set (0.00 sec)

   我擦,這回MAX能返回,MIN不能了,這又是為啥呢?

   旁白

   一般來說,HAVING子句是配合GROUP BY使用的,單獨使用HAVING本身是不符合規范的,

   但是MySQL會做一個重寫,加上一個GROUP BY NULL,”SELECT * FROM t HAVING id=MIN(id)”會被重寫為”SELECT * FROM t GROUP BY NULL HAVING id=MIN(id)”,這樣語法就符合規范了。

   繼續……

   但是,這個 GROUP BY NULL 會產生什麼結果呢?經過查看代碼和試驗,可以證明,GROUP BY NULL 等價於 LIMIT 1:

root@localhost : plx 10:25:48> SELECT * FROM t2 GROUP BY NULL;
+------+----+
| a  | id |
+------+----+
|  10 | 1 |
+------+----+
1 row in set (0.00 sec)

   也就是說,GROUP BY NULL 以後,只會有一個分組,裡面就是第一行數據。

   但是如果這樣,MIN、MAX結果應該是一致的,那也不應該MAX和MIN一個有結果,一個沒結果啊,這是為什麼呢,再做一個測試。

   修改一下數據,然後直接查看MIN/MAX的值:

root@localhost : plx 10:26:58> select * from t2;
+------+----+
| a  | id |
+------+----+
|  10 | 1 |
|  1 | 3 |
+------+----+
2 rows in set (0.00 sec)
 
root@localhost : plx 10:27:04> SELECT * FROM t2 GROUP BY NULL;
+------+----+
| a  | id |
+------+----+
|  10 | 1 |
+------+----+
1 row in set (0.00 sec)
 
root@localhost : plx 10:30:21> SELECT MAX(a),MIN(a),MAX(id),MIN(id) FROM t2 GROUP BY NULL;
+--------+--------+---------+---------+
| MAX(a) | MIN(a) | MAX(id) | MIN(id) |
+--------+--------+---------+---------+
|   10 |   1 |    3 |    1 |
+--------+--------+---------+---------+
1 row in set (0.00 sec)

   是不是發現問題了?

   MAX/MIN函數取值是全局的,而不是LIMIT 1這個分組內的。

   因此,當GROUP BY NULL的時候,MAX/MIN函數是取所有數據裡的最大和最小值!

   所以啊,”SELECT * FROM t HAVING id=MIN(id)”本質上是”SELECT * FROM t HAVING id=1″, 就能返回一條記錄,而”SELECT * FROM t HAVING id=MAX(id)”本質上是”SELECT * FROM t HAVING id=3″,當然沒有返回記錄,這就是問題的根源。

   測試一下GROUP BY a,這樣就對了,每個分組內只有一行,所以MAX/MIN一樣大,這回是取得組內最大和最小值。

root@localhost : plx 11:29:49> SELECT MAX(a),MIN(a),MAX(id),MIN(id) FROM t2 GROUP BY a;
+--------+--------+---------+---------+
| MAX(a) | MIN(a) | MAX(id) | MIN(id) |
+--------+--------+---------+---------+
|   1 |   1 |    3 |    3 |
|   10 |   10 |    5 |    5 |
+--------+--------+---------+---------+
2 rows in set (0.00 sec)

   GROUP BY NULL時MAX/MIN的行為,是這個問題的本質,所以啊,盡量使用標准語法,玩花樣SQL之前,一定要搞清楚它的行為是否與理解的一致。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved