程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> MySQL collation辦法

MySQL collation辦法

編輯：MySQL綜合教程

MySQL collation辦法。本站提示廣大學習愛好者：（MySQL collation辦法）文章只能為提供參考，不一定能成為您想要的結果。以下是MySQL collation辦法正文

成績是如許的：
一張test的表，字符集采取的latin1。

select to_id from test where to_id='cn象_王';
+---------------+
| to_id |
+---------------+
| cn陶_陶 |
| cn象_王 |
+---------------+
2 rows in set (0.00 sec)

取cn象_王的數據,竟然把cn陶_陶的數據也取回來了。
這明顯是不許可的。

檢查它們的編碼：

(root@im_offlog1a)[test]> select hex('cn陶_陶');
+----------------+
| hex('cn陶_陶') |
+----------------+
| 636ECCD55FCCD5 |
+----------------+
1 row in set (0.00 sec)

(root@im_offlog1a)[test]> select hex('cn象_王');
+----------------+
| hex('cn象_王') |
+----------------+
| 636ECFF35FCDF5 |
+----------------+
1 row in set (0.00 sec)

編碼切實其實是紛歧樣的，然則為何mysql會以為這兩筆記錄是一樣的呢？

一開端我們就把成績定位於collation惹起的成績。

show variables檢查
| collation_connection | latin1_swedish_ci
| collation_database | latin1_swedish_ci
| collation_server | latin1_swedish_ci

手工把這些參數修正為latin1_bin，成果竟然一樣。這下感到真是奇異了。

這裡先說明一下mysql collation的定名規矩：
它們以其相干的字符集名開端，平日包含一個說話名，而且以_ci（年夜小寫不敏感）、_cs（年夜小寫敏感）或_bin（二元）停止

好比latin1字符集有以下幾種校訂規矩：

校訂規矩寄義
latin1_german1_ci 德國DIN-1
latin1_swedish_ci 瑞典/芬蘭
latin1_danish_ci 丹麥/挪威
latin1_german2_ci 德國 DIN-2
latin1_bin 相符latin1編碼的二進制
latin1_general_ci 多種說話(西歐)
latin1_general_cs 多種說話(西歐ISO),年夜小寫敏感
latin1_spanish_ci 古代西班牙

最初我們將表格重建，手工指定表格級其余collation為latin1_bin。
這個成績就獲得懂得決。

那末成績又來了，為何我後面手工測試latin1_bin時不失效呢？

本來MySQL依照上面的方法選擇表字符集和校訂規矩：
假如指定了CHARACTER SET X和COLLATE Y，那末采取CHARACTER SET X和COLLATE Y。
假如指定了CHARACTER SET X而沒有指定COLLATE Y，那末采取CHARACTER SET X和CHARACTER SET X的默許校訂規矩。
不然，采取辦事器字符集和辦事器校訂規矩。

而我們在建表的時刻指定了character set，所以它永久是采取對應的默許的校訂規矩。

固然我們其實也沒需要重建表格，只須要alter table db_allot CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin如許轉換便可。

別的建議collation都盡可能采取字符集響應的bin類型的校訂規矩，如許不輕易失足。

再說說我本身的領會

認為 character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改良，只是新版的先用 character set 定字符集，再用此字符集名字加 _bin 定校訂規矩為二進制的，從而確保中文查詢准確。
再測試了一下，把此字段屬性改成不帶 BINARY 的
ALTER TABLE `comment_content_1_01` CHANGE `thread` `thread` VARCHAR( 50 ) DEFAULT NULL
然後再看表構造確切釀成 `thread` varchar(50) default NULL, 即不帶 character set latin1 collate latin1_bin 了，可見character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改良。

另外還讀到更便利的做法，不消逐一改字段屬性，而只需表格級其余collation為latin1_bin就好了。
測試：
alter table comment_content_1_01 CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin
後，

再導出表構造

CREATE TABLE comment_content_1_01 (
content_id int(11) NOT NULL auto_increment,
thread varchar(50) collate latin1_bin default NULL,
uname varchar(100) collate latin1_bin default NULL,
nick varchar(100) collate latin1_bin default NULL,
uid int(11) unsigned default NULL,
content text collate latin1_bin,
post_time datetime default NULL,
post_ip int(10) unsigned default NULL,
`status` enum('unaudit','normal','deleted') collate latin1_bin NOT NULL default 'unaudit',
PRIMARY KEY (content_id)
) ENGINE=MyISAM DEFAULT CHARSET=latin1 COLLATE=latin1_bin;

即使本來沒定各字段的 collate，如今也全都是 collate latin1_bin 了。