程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> 關於C++ >> 讓TRichEdit支持BIG5內碼

讓TRichEdit支持BIG5內碼

編輯:關於C++

大家好,現在的軟件如:Foxmail等軟件,都有顯示GB內碼和BIG5內碼的功能。我經過一段時間的摸索,發現了實現這種功能的方法。現在就來介紹給大家。首先,要給大家介紹一下這兩種內碼:大家都知道英文的ASCII碼是用一個字節來表示的,但中文因為文字數量太多,所以只能用兩個字節來表示。實際上我們常見的文本文件中保存的就是每個漢字對應的內碼,而漢字的內碼就是該漢字在中文字庫中的邏輯位置。在中文字庫中,該邏輯位置存放了這個漢字的圖像信息,有了這些圖像信息,就可以顯示該漢字了,當然在現在的Windows中這個顯示的過程是由操作系統自動來完成的,我們不必去關心它。但是由於一些歷史上的原因,漢字的內碼方案有兩種,我們大陸地區使用的是GB碼,而台灣省卻使用的是BIG5碼。GB碼文件中保存的是漢字相應的GB編碼,BIG5碼文件中保存的是漢字相應的BIG5編碼。而兩種內碼又都對應於各自的字庫文件,所以當我們使用GB內碼的簡體中文Windows來看BIG5內碼的文件時,就會產生常說的亂碼現象。

由於我們是要顯示BIG5碼的漢字,所以再介紹一下BIG5碼的編碼方案:每個漢字由兩個字節構成,第一字節的范圍從0X81-0XFE,第二個字節的范圍分別為0X40-0X7E,0XA1-0XFE。好了,知道了漢字顯示的原理和BIG5碼的編碼方案,就可以很容易讓TRichEdit支持BIG5碼了。

第一步:找一個用於內碼轉換的碼表文件。

我用的是CCDOS97裡帶的CCDOS.TAB,這個文件的大小為45840個字節。如果你沒有這個文件,可以給我來信([email protected])我會寄一個給你。當然你還可以根據BIG5碼的編碼方案自己做一個,這裡就不多說了。

第二步:把碼表文件轉換成數組文件。見下面的程序。

用BCB建立一個控制台應用程序。把它存為TABTOHEX.BPR和TABTOHEX.CPP。然後在TABTOHEX.cpp中添加以下代碼:

#pragma hdrstop
#include <condefs.h>
#include"stdio.h"
#include"stdlib.h"
#pragma argsused
int main(int argc, char **argv)
{
   FILE *tab;
   FILE *hex;
   int i=0;
   unsigned int ch;
   tab=fopen("ccdos.tab","rb");//打開CCDOS.TAB文件
   hex=fopen("tab.h","wb");
   fputs("unsigned char tab[45840]={",hex);
   fprintf(hex,"\n");
   for(i=0;i<45840;i++)
   {
     if(i%20==0)
     {
       fprintf(hex,"\n");
     }
     ch=fgetc(tab);
     fprintf(hex,"0x%x\x2c",ch);//把碼表文件轉換為數組文件
   }
   fputs("0xff};",hex);
   fcloseall();
   return 0;
}

然後編譯並執行這個程序,得到TAB.H文件。

第三步:在BCB3.0中新建一個標准的應用程序。添加一個TButton組件:Button1添加一個TRichEdit組件:RichEdit1適當調整它們的大小與位置。然後在Unit1.cpp中添加下面的代碼:

#include <vcl.h>
#pragma hdrstop
#include "Unit1.h"
#include"tab.h"//把頭文件TAB.H包含在內
//---------------------------------------------------------------------------
#pragma package(smart_init)
#pragma resource "*.dfm"
TForm1 *Form1;
//---------------------------------------------------------------------------
__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)
{
}
//---------------------------------------------------------------------------
void __fastcall TForm1::FormCreate(TObject *Sender)
{
   RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//讀取一個BIG5碼的文件,可自己的情況設定
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button1Click(TObject *Sender)
{
   unsigned long i,address;//把BIG5碼轉換為GB碼
   unsigned char ch1,ch2;
   char *x;
   x=RichEdit1->Lines->GetText();
   i=0;
   while(x[i]!='\0')
   {
     ch1=x[i];
     if(ch1>=0xa1)
     {
       ch2=x[i+1];
       if(ch2>=0x40&&ch2<=0x7e)
       {
         address=ch1*314+ch2*2-33010;
         x[i]=tab[address];
         x[i+1]=tab[address+1];
       }
       if(ch2>=0xa1&&ch2<=0xfe)
       {
         address=ch1*314+ch2*2-33078;
         x[i]=tab[address];
         x[i+1]=tab[address+1];
       }
       i+=2;
     }
     else
     i++;
   }
   RichEdit1->Lines->Text=x;
   RichEdit1->SetFocus();
   RichEdit1->SelStart = 0;
}

編譯並執行它,首先你會看到RichEdit1中的BIG5碼文件顯示為亂碼。按一下Button1,這時,你就會看到RichEdit1中的亂碼變成了正常的漢字。好了,現在你自己編的軟件也可以支持BIG5碼了,是不是感覺更專業一些。GB->BIG5的轉換方法也是類似的,有興趣的朋友可以給我來信。最後,祝大家龍年愉快。本程序在WIN97,BCB3.0下編譯通過。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved