程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql的3種分表計劃

mysql的3種分表計劃

編輯:MySQL綜合教程

mysql的3種分表計劃。本站提示廣大學習愛好者:(mysql的3種分表計劃)文章只能為提供參考,不一定能成為您想要的結果。以下是mysql的3種分表計劃正文


1、先說一下為何要分表:
當一張的數據到達幾百萬時,你查詢一次所花的時光會變多,假如有結合查詢的話,有能夠會逝世在那兒了。分表的目標就在於此,減小數據庫的累贅,延長查詢時光。

依據小我經歷,mysql履行一個sql的進程以下:
1、吸收到sql; 
2、把sql放到列隊隊列中;
3、履行sql; 
4、前往履行成果。
在這個履行進程中最花時光在甚麼處所呢?第一,是列隊期待的時光,第二,sql的履行時光。其實這二個是一回事,期待的同時,確定有sql在履行。所以我們要延長sql的履行時光。

mysql中有一種機制是表鎖定和行鎖定,為何要湧現這類機制,是為了包管數據的完全性,我舉個例子來講吧,假如有二個sql都要修正統一張表的統一條數據,這個時刻怎樣辦呢,是否是二個sql都可以同時修正這條數據呢?很明顯mysql對這類情形的處置是,一種是表鎖定(myisam存儲引擎),一個是行鎖定(innodb存儲引擎)。表鎖定表現你們都不克不及對這張表停止操作,必需等我對表操作完才行。行鎖定也一樣,其余sql必需等我對這條數據操作完了,能力對這條數據停止操作。假如數據太多,一次履行的時光太長,期待的時光就越長,這也是我們為何要分表的緣由。  

2、分表

1,做mysql集群,例如:應用mysql cluster ,mysql proxy,mysql replication,drdb等等

有人會問mysql集群,根分表有甚麼關系嗎?固然它不是現實意義上的分表,然則它啟到了分表的感化,做集群的意義是甚麼呢?為一個數據庫加重累贅,說白了就是削減sql列隊隊列中的sql的數目,舉個例子:有10個sql要求,假如放在一個數據庫辦事器的列隊隊列中,他要等很長時光,假如把這10個sql要求,分派到5個數據庫辦事器的列隊隊列中,一個數據庫辦事器的隊列中只要2個,如許期待時光是否是年夜年夜的延長了呢?這曾經很顯著了。所以我把它列到了分表的規模之內,我做過一些mysql的集群:

linux mysql proxy 的裝置,設置裝備擺設,和讀寫分別
mysql replication 互為主從的裝置及設置裝備擺設,和數據同步
長處:擴大性好,沒有多個分表後的龐雜操作(php代碼)
缺陷:單個表的數據量照樣沒有變,一次操作所花的時光照樣那末多,硬件開支年夜。

2,事後估量會湧現年夜數據量而且拜訪頻仍的表,將其分為若干個表

這類預估年夜差不差的,服裝論壇t.vhao.net外面揭橥帖子的表,時光長了這張表確定很年夜,幾十萬,幾百萬都有能夠。 聊天室外面信息表,幾十小我在一路一聊一個早晨,時光長了,這張表的數據確定很年夜。像如許的情形許多。所以這類能預估出來的年夜數據量表,我們就事前分出個N個表,這個N是若干,依據現實情形而定。以聊天信息表為例:

我事前建100個如許的表,message_00,message_01,message_02……….message_98,message_99.然後依據用戶的ID來斷定這個用戶的聊天信息放到哪張內外面,你可以用hash的方法來取得,可以用求余的方法來取得,辦法許多,大家想大家的吧。上面用hash的辦法來取得表名:


<?php
function get_hash_table($table,$userid) {
 $str = crc32($userid);
 if($str<0){
  $hash = "0".substr(abs($str), 0, 1);
 }else{
  $hash = substr($str, 0, 2);
 }
 return $table."_".$hash;
}   

echo get_hash_table('message' , 'user18991');     //成果為message_10
echo get_hash_table('message' , 'user34523');    //成果為message_13
?> 

解釋一下,下面的這個辦法,告知我們user18991這個用戶的新聞都記載在message_10這張內外,user34523這個用戶的新聞都記載在message_13這張內外,讀取的時刻,只需從各自的表中讀取就好了。

長處:防止一張表湧現幾百萬條數據,延長了一條sql的履行時光

缺陷:當一種規矩肯定時,打破這條規矩會很費事,下面的例子中我用的hash算法是crc32,假如我如今不想用這個算法了,改用md5後,會使統一個用戶的新聞被存儲到分歧的表中,如許數據亂套了。擴大性很差。

3,應用merge存儲引擎來完成分表

我認為這類辦法比擬合適,那些沒有事前斟酌,罷了經湧現了得,數據查詢慢的情形。這個時刻假如要把已有的年夜數據量表離開比擬苦楚,最苦楚的事就是改代碼,由於法式外面的sql語句曾經寫好了,如今一張表要分紅幾十張表,乃至上百張表,如許sql語句是否是要重寫呢?舉個例子,我很愛好舉例子

mysql>show engines;的時刻你會發明mrg_myisam其實就是merge。

mysql> CREATE TABLE IF NOT EXISTS `user1` (
 ->   `id` int(11) NOT NULL AUTO_INCREMENT,
 ->   `name` varchar(50) DEFAULT NULL,
 ->   `sex` int(1) NOT NULL DEFAULT '0',
 ->   PRIMARY KEY (`id`)
 -> ) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
Query OK, 0 rows affected (0.05 sec)   

mysql> CREATE TABLE IF NOT EXISTS `user2` (
 ->   `id` int(11) NOT NULL AUTO_INCREMENT,
 ->   `name` varchar(50) DEFAULT NULL,
 ->   `sex` int(1) NOT NULL DEFAULT '0',
 ->   PRIMARY KEY (`id`)
 -> ) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
Query OK, 0 rows affected (0.01 sec)   

mysql> INSERT INTO `user1` (`name`, `sex`) VALUES('張映', 0);
Query OK, 1 row affected (0.00 sec)   

mysql> INSERT INTO `user2` (`name`, `sex`) VALUES('tank', 1);
Query OK, 1 row affected (0.00 sec)   

mysql> CREATE TABLE IF NOT EXISTS `alluser` (
 ->   `id` int(11) NOT NULL AUTO_INCREMENT,
 ->   `name` varchar(50) DEFAULT NULL,
 ->   `sex` int(1) NOT NULL DEFAULT '0',
 ->   INDEX(id)
 -> ) TYPE=MERGE UNION=(user1,user2) INSERT_METHOD=LAST AUTO_INCREMENT=1 ;
Query OK, 0 rows affected, 1 warning (0.00 sec)   

mysql> select id,name,sex from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
|  1 | 張映    |   0 |
|  1 | tank   |   1 |
+----+--------+-----+
2 rows in set (0.00 sec)   

mysql> INSERT INTO `alluser` (`name`, `sex`) VALUES('tank2', 0);
Query OK, 1 row affected (0.00 sec)   

mysql> select id,name,sex from user2
 -> ;
+----+-------+-----+
| id | name  | sex |
+----+-------+-----+
|  1 | tank  |   1 |
|  2 | tank2 |   0 |
+----+-------+-----+
2 rows in set (0.00 sec) 

mysql> CREATE TABLE IF NOT EXISTS `user1` (  ->   `id` int(11) NOT NULL AUTO_INCREMENT,  ->   `name` varchar(50) DEFAULT NULL,  ->   `sex` int(1) NOT NULL DEFAULT '0',  ->   PRIMARY KEY (`id`)  -> ) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; Query OK, 0 rows affected (0.05 sec)  mysql> CREATE TABLE IF NOT EXISTS `user2` (  ->   `id` int(11) NOT NULL AUTO_INCREMENT,  ->   `name` varchar(50) DEFAULT NULL,  ->   `sex` int(1) NOT NULL DEFAULT '0',  ->   PRIMARY KEY (`id`)  -> ) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; Query OK, 0 rows affected (0.01 sec)  mysql> INSERT INTO `user1` (`name`, `sex`) VALUES('張映', 0); Query OK, 1 row affected (0.00 sec)  mysql> INSERT INTO `user2` (`name`, `sex`) VALUES('tank', 1); Query OK, 1 row affected (0.00 sec)  mysql> CREATE TABLE IF NOT EXISTS `alluser` (  ->   `id` int(11) NOT NULL AUTO_INCREMENT,  ->   `name` varchar(50) DEFAULT NULL,  ->   `sex` int(1) NOT NULL DEFAULT '0',  ->   INDEX(id)  -> ) TYPE=MERGE UNION=(user1,user2) INSERT_METHOD=LAST AUTO_INCREMENT=1 ; Query OK, 0 rows affected, 1 warning (0.00 sec)  mysql> select id,name,sex from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
|  1 |  張映   |   0 |
|  1 | tank   |   1 |
+----+--------+-----+
2 rows in set (0.00 sec)

mysql> INSERT INTO `alluser` (`name`, `sex`) VALUES('tank2', 0); Query OK, 1 row affected (0.00 sec)  mysql> select id,name,sex from user2  -> ;

+----+-------+-----+
| id | name  | sex |
+----+-------+-----+
|  1 | tank  |   1 |
|  2 | tank2 |   0 |
+----+-------+-----+
2 rows in set (0.00 sec)

從下面的操作中,我不曉得你有無發明點甚麼?假設我有一張用戶表user,有50W條數據,如今要拆成二張表user1和user2,每張表25W條數據,

INSERT INTO user1(user1.id,user1.name,user1.sex)SELECT (user.id,user.name,user.sex)FROM user where user.id <= 250000

INSERT INTO user2(user2.id,user2.name,user2.sex)SELECT (user.id,user.name,user.sex)FROM user where user.id > 250000

如許我就勝利的將一張user表,分紅了二個表,這個時刻有一個成績,代碼中的sql語句怎樣辦,之前是一張表,如今釀成二張表了,代碼修改很年夜,如許給法式員帶來了很年夜的任務量,有無好的方法處理這一點呢?方法是把之前的user表備份一下,然後刪除失落,下面的操作中我樹立了一個alluser表,只把這個alluser表的表名改成user就好了。然則,不是一切的mysql操作都能用的

a,假如你應用 alter table 來把 merge 表變成其它表類型,究竟層表的映照就被喪失了。取而代之的,來自底層 myisam 表的行被復制到已改換的表中,該表隨後被指定新類型。

b,網上看到一些說replace不起感化,我試了一下可以起感化的。暈一個先

mysql> UPDATE alluser SET sex=REPLACE(sex, 0, 1) where id=2;
Query OK, 1 row affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0   

mysql> select * from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
|  1 | 張映    |   0 |
|  1 | tank   |   1 |
|  2 | tank2  |   1 |
+----+--------+-----+
3 rows in set (0.00 sec) 

mysql> UPDATE alluser SET sex=REPLACE(sex, 0, 1) where id=2; Query OK, 1 row affected (0.00 sec) Rows matched: 1  Changed: 1  Warnings: 0  mysql> select * from alluser;
 +----+--------+-----+
 | id | name   | sex |
 +----+--------+-----+
 |  1 | 張映    |   0 |
 |  1 | tank   |   1 |
 |  2 | tank2  |   1 |
 +----+--------+-----+
 3 rows in set (0.00 sec)

c,一個 merge 表不克不及在全部表上保持 unique 束縛。當你履行一個 insert,數據進入第一個或許最初一個 myisam 表(取決於 insert_method 選項的值)。mysql 確保獨一鍵值在誰人 myisam 內外堅持獨一,但不是跨聚集裡一切的表。

d,當你創立一個 merge 表之時,沒有檢討去確保底層表的存在和有雷同的機構。當 merge 表被應用之時,mysql 檢討每一個被映照的表的記載長度能否相等,但這其實不非常靠得住。假如你從不類似的 myisam 表創立一個 merge 表,你異常有能夠撞見奇異的成績。

c和d在網上看到的,沒有測試,年夜家試一下吧。

長處:擴大性好,而且法式代碼修改的不是很年夜

缺陷:這類辦法的後果比第二種要差一點

3、總結一下

下面提到的三種辦法,我現實做過二種,第一種和第二種。第三種沒有做過,所以說的細一點。哈哈。做甚麼事都有一個度,跨越個度就過變得很差,不克不及一味的做數據庫辦事器集群,硬件是要花錢買的,也不要一味的分表,分出來1000表,mysql的存儲歸根究竟還以文件的情勢存在硬盤下面,一張表對應三個文件,1000個分表就是對應3000個文件,如許檢索起來也會變的很慢。我的建議是

辦法1和辦法2聯合的方法來停止分表
辦法1和辦法3聯合的方法來停止分表

我的二個建議合適分歧的情形,依據小我情形而定,我認為會有許多人選擇辦法1和辦法3聯合的方法

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved