程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> 關於C語言 >> 用C語言實現常見的三種中文內碼轉換

用C語言實現常見的三種中文內碼轉換

編輯:關於C語言

常見的中文內碼一般有GB2312(簡體中文),GBK和台灣那邊用的BIG5(繁體中文),有時候看一些台灣編程論壇裡的資料,都是亂碼,如果在IE中浏覽,則要求安裝繁體字庫的支持。網上也有很多中文內碼的轉換工具,什麼專家,大師,巨匠之類所有光輝燦爛的名字都被使用了,但是在自己的程序中集成這些功能豈不是更好。以前曾廣泛流傳過使用碼表來轉換中文內碼的Code,但畢竟不完美,而且還要攜帶或內置一個巨大的表,浪費資源。Windows中提供了MultiByteToWideChar和WideCharToMultiByte兩兄弟函數,足可以搞定這些功能了。

以下四個函數分別實現:

大五碼轉GBK碼/GBK轉大五碼

GB2312碼轉GBK碼/GBK碼轉GB2312碼

於是有人要問了,為什麼沒有GB2312轉BIG5和BIG5轉GB2312呢,我們有GBK,可以做一下中轉啊。可以將GB2312轉成GBK,再將GBK轉成BIG5,反之亦然。如果你嫌麻煩,可以自己寫一個GB2BIG5/BIG52GB。

//---------------------------------------------------------------------------

// 大五碼轉GBK碼:

// い地チ㎝瓣 --> 中華人民共和國
void __fastcall BIG52GBK(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
wchar_t *pws = new wchar_t[nStrLen + 1];
try
{
int nReturn = MultiByteToWideChar(950, 0, szBuf, nStrLen, pws, nStrLen + 1);
BOOL bValue = false;
nReturn = WideCharToMultiByte(936, 0, pws, nReturn, szBuf, nStrLen + 1, "?", &bValue);
szBuf[nReturn] = 0;
}
__finally
{
delete[] pws;
}
}

//---------------------------------------------------------------------------

// GBK轉大五碼

// 中華人民共和國 --> い地チ㎝瓣

void __fastcall GBK2BIG5(char *szBuf)
{
if(!strcmp(szBuf, ""))
return ;
int nStrLen = strlen(szBuf);
wchar_t *pws = new wchar_t[nStrLen + 1];
try
{
MultiByteToWideChar(936, 0, szBuf, nStrLen, pws, nStrLen + 1);
BOOL bValue = false;
WideCharToMultiByte(950, 0, pws, nStrLen, szBuf, nStrLen + 1, "?", &bValue);
szBuf[nStrLen] = 0;
}
__finally
{
delete[] pws;
}
}

//----------------------------------------------------------------------------

// GB2312碼轉GBK碼

// 中華人民共和國 --> 中華人民共和國
void __fastcall GB2GBK(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
WORD wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
int nReturn = LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nStrLen, NULL, 0);
if(!nReturn)
return;
char *pcBuf = new char[nReturn + 1];
try
{
wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
strncpy(szBuf, pcBuf, nReturn);
}
__finally
{
delete[] pcBuf;
}
}

//---------------------------------------------------------------------------

// GBK碼轉GB2312碼

// 中華人民共和國 --> 中華人民共和國
void __fastcall GBK2GB(char *szBuf)
{
if(!strcmp(szBuf, ""))
return;
int nStrLen = strlen(szBuf);
WORD wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
int nReturn = LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nStrLen, NULL, 0);
if(!nReturn)
return;
char *pcBuf = new char[nReturn + 1];
try
{
wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
strncpy(szBuf, pcBuf, nReturn);
}
__finally
{
delete []pcBuf;
}
}
//---------------------------------------------------------------------------

// 測試代碼

void __fastcall TForm1::Button1Click(TObject *Sender)
{
char szBuf[255];
// 從GB2312轉到GBK
strcpy(szBuf, Edit1->Text.c_str());
GB2GBK(szBuf);
Edit2->Text = String(szBuf);
// 從GB2312轉到BIG5,通過GBK中轉
strcpy(szBuf, Edit1->Text.c_str());
GB2GBK(szBuf);
GBK2BIG5(szBuf);
Edit3->Text = String(szBuf);
}

注意,請不要使用String類的c_str()作為上述幾個函數的傳入參數。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved