程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> 從最近MySQL的優化工作想到的

從最近MySQL的優化工作想到的

編輯:MySQL綜合教程

最近決定將以前同事寫的存儲過程查看一遍,尋找一些代碼上寫的不太好的地方,爭取進行修改以後讓這些過程達到一個很好的運行速度。下面是遇到的最多的幾個問題。

我遇到了這樣的一個SQL:

select name, count(*) from (select name from table_1) a group by a.name;

MySQL的執行計劃對於這種派生表的解釋非常的不友好,但是能直觀的感覺到的是,這個SQL執行速度特別的慢。查看這個表table_1發現,name字段是有索引的。審視這段代碼,可以推斷出當時程序員的想法,應該是想讓數據庫掃描更小的結果集,因為select *是很不好的習慣。不過他應該忽略了一個MySQL的很重要的特點就是索引。MySQL的索引是個很有意思的東西,是我從Oracle轉過來感覺最好玩的東西,好玩的地方就在於,可以優化group by。當我把這個SQL改成如下SQL以後:

select name, count(*) from table_1 group by name;

這樣一來,這段SQL的執行速度就非常的快了,extra列明確的顯示了using index,索引覆蓋查詢,速度槓槓的。

其實這種錯誤應該是程序員常犯的,因為程序員對Java等代碼超級熟悉,但是對於SQL,基本上都是大學的時候學習的SQL,用SQLServer練出來的,基本上沒有對數據庫進行非常深入的研究,其實每種數據庫中,同一條SQL的執行計劃都是不盡相同的,這也就是企業有一個專業的DBA的一個作用。

下面,就是一個讓人很頭疼的錯誤:

select name, userid from table_1 where name = null;

不管是MySQL還是Oracle,對這種SQL的寫法的規范都是where name is (not) null。null這個值,在不管什麼數據庫裡都是一個讓人(包括程序員和DBA)都很頭疼的東西。我對MySQL的理解還不夠深入,但是根據某一本《Oracle DBA手記》中記載,Oracle中每種數據類型的null都代表了不一樣的意義。

做了下面一個實驗:

可以看出來,不管是“= null”還是“<> null”,得到的值其實都是不確定,也就是null。因此,必須要寫成is (not) null。在《劍破冰山》這本書裡也有對Oracle的null值的詳細介紹。

總結一下最近的工作,我研究了小半年時間的MySQL,發現這個開源的數據庫並不像我過去認為的那樣,就是一個互聯網數據庫。這個數據庫在面向OLAP復雜計算的方面確實和Oracle,DB2等商用數據庫之間有不小的差距,不過在MariaDB這個分支中,這部分有了不小的進步,相信後面的MySQL版本中也會越來越好。其實這個數據庫最讓我感興趣的不是開源,因為我確實看不懂那麼長的源代碼,我的C語言水平就是大學畢業水平。這個數據庫最讓我感興趣(起碼現在來講)是它的索引,它的索引和Oracle有很大的不同,尤其是InnoDB的表整個就是用索引組織起來的,在簡單的查詢的時候,一個索引覆蓋查詢就可以無敵於天下了,在group by和order by的時候,如果是索引字段,效率會相當的高。

其實我還想說的就是,一個團隊裡,如果涉及到大量存儲過程的編寫,一定要有一個專業的DBA人員參與其中。SQL是一個標准,橫跨了所有的關系型數據庫,但是每一種關系型數據庫對SQL的實現又不盡相同,因此同樣的一段SQL,放到不同的數據庫上執行,效率上就會千差萬別。而SQL又非常容易用人最習慣最簡單的思維寫出來,比如搜索一個訂單表裡美國員工生成的訂單信息,SQL有可能是這樣的:

select * from orders t1
 where t1.employee_id in (select employee_id from employee t2 
 where t2.nation = 'USA');

如果是Oracle這樣的商業數據庫,這個SQL的執行效率可能會比較好,但是應該不如用exists的SQL。但是當這段SQL在MySQL中執行的時候,效率就很差了,因為很多人都知道,MySQL的子查詢效率實在是不敢恭維。這段代碼會被改為相關子查詢,而且隨著數據量的增長,執行時間會越來越長。這段代碼如果改成下面的SQL,效果會更好:

select t1.*
  from orders t1
inner join employee t2
    on t1.employee_id = t2.employee_id
where t2.nation = 'USA';

如果表上有索引,執行速度快極了。

寫SQL,還是要首先研究這個數據庫的原理,然後慎而又慎的寫。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved