程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql的3種分表計劃

mysql的3種分表計劃

編輯：MySQL綜合教程

mysql的3種分表計劃。本站提示廣大學習愛好者：（mysql的3種分表計劃）文章只能為提供參考，不一定能成為您想要的結果。以下是mysql的3種分表計劃正文

1、先說一下為何要分表：
當一張的數據到達幾百萬時，你查詢一次所花的時光會變多，假如有結合查詢的話，有能夠會逝世在那兒了。分表的目標就在於此，減小數據庫的累贅，延長查詢時光。

依據小我經歷，mysql履行一個sql的進程以下：
1、吸收到sql;
2、把sql放到列隊隊列中;
3、履行sql;
4、前往履行成果。
在這個履行進程中最花時光在甚麼處所呢？第一，是列隊期待的時光，第二，sql的履行時光。其實這二個是一回事，期待的同時，確定有sql在履行。所以我們要延長sql的履行時光。

mysql中有一種機制是表鎖定和行鎖定，為何要湧現這類機制，是為了包管數據的完全性，我舉個例子來講吧，假如有二個sql都要修正統一張表的統一條數據，這個時刻怎樣辦呢，是否是二個sql都可以同時修正這條數據呢？很明顯mysql對這類情形的處置是，一種是表鎖定（myisam存儲引擎），一個是行鎖定（innodb存儲引擎）。表鎖定表現你們都不克不及對這張表停止操作，必需等我對表操作完才行。行鎖定也一樣，其余sql必需等我對這條數據操作完了，能力對這條數據停止操作。假如數據太多，一次履行的時光太長，期待的時光就越長，這也是我們為何要分表的緣由。

2、分表

1，做mysql集群，例如：應用mysql cluster ，mysql proxy，mysql replication，drdb等等

有人會問mysql集群，根分表有甚麼關系嗎？固然它不是現實意義上的分表，然則它啟到了分表的感化，做集群的意義是甚麼呢？為一個數據庫加重累贅，說白了就是削減sql列隊隊列中的sql的數目，舉個例子：有10個sql要求，假如放在一個數據庫辦事器的列隊隊列中，他要等很長時光，假如把這10個sql要求，分派到5個數據庫辦事器的列隊隊列中，一個數據庫辦事器的隊列中只要2個，如許期待時光是否是年夜年夜的延長了呢？這曾經很顯著了。所以我把它列到了分表的規模之內，我做過一些mysql的集群：

linux mysql proxy 的裝置，設置裝備擺設，和讀寫分別
mysql replication 互為主從的裝置及設置裝備擺設，和數據同步
長處：擴大性好，沒有多個分表後的龐雜操作（php代碼）
缺陷：單個表的數據量照樣沒有變，一次操作所花的時光照樣那末多，硬件開支年夜。

2，事後估量會湧現年夜數據量而且拜訪頻仍的表，將其分為若干個表

這類預估年夜差不差的，服裝論壇t.vhao.net外面揭橥帖子的表，時光長了這張表確定很年夜，幾十萬，幾百萬都有能夠。聊天室外面信息表，幾十小我在一路一聊一個早晨，時光長了，這張表的數據確定很年夜。像如許的情形許多。所以這類能預估出來的年夜數據量表，我們就事前分出個N個表，這個N是若干，依據現實情形而定。以聊天信息表為例：

我事前建100個如許的表，message_00,message_01,message_02……….message_98,message_99.然後依據用戶的ID來斷定這個用戶的聊天信息放到哪張內外面，你可以用hash的方法來取得，可以用求余的方法來取得，辦法許多，大家想大家的吧。上面用hash的辦法來取得表名：

<?php
function get_hash_table($table,$userid) {
$str = crc32($userid);
if($str<0){
  $hash = "0".substr(abs($str), 0, 1);
}else{
  $hash = substr($str, 0, 2);
}
return $table."_".$hash;
}

echo get_hash_table('message' , 'user18991'); //成果為message_10
echo get_hash_table('message' , 'user34523'); //成果為message_13
?>

解釋一下，下面的這個辦法，告知我們user18991這個用戶的新聞都記載在message_10這張內外，user34523這個用戶的新聞都記載在message_13這張內外，讀取的時刻，只需從各自的表中讀取就好了。

長處：防止一張表湧現幾百萬條數據，延長了一條sql的履行時光

缺陷：當一種規矩肯定時，打破這條規矩會很費事，下面的例子中我用的hash算法是crc32，假如我如今不想用這個算法了，改用md5後，會使統一個用戶的新聞被存儲到分歧的表中，如許數據亂套了。擴大性很差。

3，應用merge存儲引擎來完成分表

我認為這類辦法比擬合適，那些沒有事前斟酌，罷了經湧現了得，數據查詢慢的情形。這個時刻假如要把已有的年夜數據量表離開比擬苦楚，最苦楚的事就是改代碼，由於法式外面的sql語句曾經寫好了，如今一張表要分紅幾十張表，乃至上百張表，如許sql語句是否是要重寫呢？舉個例子，我很愛好舉例子

mysql>show engines;的時刻你會發明mrg_myisam其實就是merge。

mysql> CREATE TABLE IF NOT EXISTS `user1` (
->   `id` int(11) NOT NULL AUTO_INCREMENT,
->   `name` varchar(50) DEFAULT NULL,
->   `sex` int(1) NOT NULL DEFAULT '0',
->   PRIMARY KEY (`id`)
-> ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
Query OK, 0 rows affected (0.05 sec)

mysql> CREATE TABLE IF NOT EXISTS `user2` (
->   `id` int(11) NOT NULL AUTO_INCREMENT,
->   `name` varchar(50) DEFAULT NULL,
->   `sex` int(1) NOT NULL DEFAULT '0',
->   PRIMARY KEY (`id`)
-> ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
Query OK, 0 rows affected (0.01 sec)

mysql> INSERT INTO `user1` (`name`, `sex`) VALUES('張映', 0);
Query OK, 1 row affected (0.00 sec)

mysql> INSERT INTO `user2` (`name`, `sex`) VALUES('tank', 1);
Query OK, 1 row affected (0.00 sec)

mysql> CREATE TABLE IF NOT EXISTS `alluser` (
->   `id` int(11) NOT NULL AUTO_INCREMENT,
->   `name` varchar(50) DEFAULT NULL,
->   `sex` int(1) NOT NULL DEFAULT '0',
->   INDEX(id)
-> ) TYPE=MERGE UNION=(user1,user2) INSERT_METHOD=LAST AUTO_INCREMENT=1 ;
Query OK, 0 rows affected, 1 warning (0.00 sec)

mysql> select id,name,sex from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
| 1 | 張映    |   0 |
| 1 | tank   |   1 |
+----+--------+-----+
2 rows in set (0.00 sec)

mysql> INSERT INTO `alluser` (`name`, `sex`) VALUES('tank2', 0);
Query OK, 1 row affected (0.00 sec)

mysql> select id,name,sex from user2
-> ;
+----+-------+-----+
| id | name | sex |
+----+-------+-----+
| 1 | tank | 1 |
| 2 | tank2 | 0 |
+----+-------+-----+
2 rows in set (0.00 sec)

mysql> CREATE TABLE IF NOT EXISTS `user1` ( ->   `id` int(11) NOT NULL AUTO_INCREMENT, ->   `name` varchar(50) DEFAULT NULL, ->   `sex` int(1) NOT NULL DEFAULT '0', ->   PRIMARY KEY (`id`) -> ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; Query OK, 0 rows affected (0.05 sec) mysql> CREATE TABLE IF NOT EXISTS `user2` ( ->   `id` int(11) NOT NULL AUTO_INCREMENT, ->   `name` varchar(50) DEFAULT NULL, ->   `sex` int(1) NOT NULL DEFAULT '0', ->   PRIMARY KEY (`id`) -> ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; Query OK, 0 rows affected (0.01 sec) mysql> INSERT INTO `user1` (`name`, `sex`) VALUES('張映', 0); Query OK, 1 row affected (0.00 sec) mysql> INSERT INTO `user2` (`name`, `sex`) VALUES('tank', 1); Query OK, 1 row affected (0.00 sec) mysql> CREATE TABLE IF NOT EXISTS `alluser` ( ->   `id` int(11) NOT NULL AUTO_INCREMENT, ->   `name` varchar(50) DEFAULT NULL, ->   `sex` int(1) NOT NULL DEFAULT '0', ->   INDEX(id) -> ) TYPE=MERGE UNION=(user1,user2) INSERT_METHOD=LAST AUTO_INCREMENT=1 ; Query OK, 0 rows affected, 1 warning (0.00 sec) mysql> select id,name,sex from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
| 1 | 張映   |   0 |
| 1 | tank   |   1 |
+----+--------+-----+
2 rows in set (0.00 sec)

mysql> INSERT INTO `alluser` (`name`, `sex`) VALUES('tank2', 0); Query OK, 1 row affected (0.00 sec) mysql> select id,name,sex from user2 -> ;

+----+-------+-----+
| id | name | sex |
+----+-------+-----+
| 1 | tank | 1 |
| 2 | tank2 | 0 |
+----+-------+-----+
2 rows in set (0.00 sec)

從下面的操作中，我不曉得你有無發明點甚麼？假設我有一張用戶表user，有50W條數據，如今要拆成二張表user1和user2，每張表25W條數據，

INSERT INTO user1(user1.id,user1.name,user1.sex)SELECT (user.id,user.name,user.sex)FROM user where user.id <= 250000

INSERT INTO user2(user2.id,user2.name,user2.sex)SELECT (user.id,user.name,user.sex)FROM user where user.id > 250000

如許我就勝利的將一張user表，分紅了二個表，這個時刻有一個成績，代碼中的sql語句怎樣辦，之前是一張表，如今釀成二張表了，代碼修改很年夜，如許給法式員帶來了很年夜的任務量，有無好的方法處理這一點呢？方法是把之前的user表備份一下，然後刪除失落，下面的操作中我樹立了一個alluser表，只把這個alluser表的表名改成user就好了。然則，不是一切的mysql操作都能用的

a，假如你應用 alter table 來把 merge 表變成其它表類型，究竟層表的映照就被喪失了。取而代之的，來自底層 myisam 表的行被復制到已改換的表中，該表隨後被指定新類型。

b，網上看到一些說replace不起感化，我試了一下可以起感化的。暈一個先

mysql> UPDATE alluser SET sex=REPLACE(sex, 0, 1) where id=2;
Query OK, 1 row affected (0.00 sec)
Rows matched: 1 Changed: 1 Warnings: 0

mysql> select * from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
| 1 | 張映    |   0 |
| 1 | tank   |   1 |
| 2 | tank2 |   1 |
+----+--------+-----+
3 rows in set (0.00 sec)

mysql> UPDATE alluser SET sex=REPLACE(sex, 0, 1) where id=2; Query OK, 1 row affected (0.00 sec) Rows matched: 1 Changed: 1 Warnings: 0 mysql> select * from alluser;
+----+--------+-----+
| id | name   | sex |
+----+--------+-----+
| 1 | 張映    |   0 |
| 1 | tank   |   1 |
| 2 | tank2 |   1 |
+----+--------+-----+
3 rows in set (0.00 sec)

c，一個 merge 表不克不及在全部表上保持 unique 束縛。當你履行一個 insert，數據進入第一個或許最初一個 myisam 表（取決於 insert_method 選項的值）。mysql 確保獨一鍵值在誰人 myisam 內外堅持獨一，但不是跨聚集裡一切的表。

d,當你創立一個 merge 表之時，沒有檢討去確保底層表的存在和有雷同的機構。當 merge 表被應用之時，mysql 檢討每一個被映照的表的記載長度能否相等，但這其實不非常靠得住。假如你從不類似的 myisam 表創立一個 merge 表，你異常有能夠撞見奇異的成績。

c和d在網上看到的，沒有測試，年夜家試一下吧。

長處：擴大性好，而且法式代碼修改的不是很年夜

缺陷：這類辦法的後果比第二種要差一點

3、總結一下

下面提到的三種辦法，我現實做過二種，第一種和第二種。第三種沒有做過，所以說的細一點。哈哈。做甚麼事都有一個度，跨越個度就過變得很差，不克不及一味的做數據庫辦事器集群，硬件是要花錢買的，也不要一味的分表，分出來1000表，mysql的存儲歸根究竟還以文件的情勢存在硬盤下面，一張表對應三個文件，1000個分表就是對應3000個文件，如許檢索起來也會變的很慢。我的建議是

辦法1和辦法2聯合的方法來停止分表
辦法1和辦法3聯合的方法來停止分表

我的二個建議合適分歧的情形，依據小我情形而定，我認為會有許多人選擇辦法1和辦法3聯合的方法