程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> Java的中文編程配置心得

Java的中文編程配置心得

編輯:關於JAVA
Java的中文問題歷史悠久,連綿不絕,至今也沒有完全解決,但是上有政策下有對策,我們總是有辦法搞定它的。跟Java相關的中文問題主要有兩類,一類是編程的問題,涉及到I/O,內碼轉換等。第二類是Java運行環境的配置,涉及字體,屬性配置等。我剛剛用了一天的時間解決這些問題,覺得很有必要給自己寫個備忘錄之類的。

  我看還是從問題入手吧,這樣不致於讓大家打瞌睡。我想寫個程序,這個程序有個基本功能就是顯示文件內容,我用JTextArea來做顯示的事情,程序簡單的到家了,但是就是中文都是亂碼。我的配置是JBuilder7,JBuilder自帶的JDK1.3.3_b24,我自己裝的JDK是JDK1.4.0_02_b02,都是主流的JDK。操作系統是英文Windows2000加中文支持包。

  我嘗試換JDK,1.3.3和1.4.0都不行,down一個最新的j2sdk-1_4_1-rc也是不行,好像不是JDK的問題,於是我就把精力集中到I/O的編碼轉換上,我查閱了網上若干關於Java中文問題的文章,把編碼轉換搞的倍兒清楚,可是怎麼試,換什麼編碼折騰都不行,反而顯示的更糟糕,當初還是亂的有些規矩,就是象在純英文系統上顯示的那樣,好歹我還知道那是漢字,只是顯示不出來,等我折騰編碼,就變得都是問號了。唉,郁悶!

  編碼轉換心得:

  Java內部是UNICODE編碼,在I/O時如果使用Reader/Writer就要發生編碼轉換,使用系統屬性file.encoding作為編碼方式。如果使用Stream就沒有轉換的事情了,那是Binary的數據。

  有用的方法有:1。在Reader/Writer上加encoding的選項,注意編碼的方向,在Reader中的encoding表示把數據從encoding轉換成Unicode,writer就是把Unicode的字符轉換成encoding格式的。2。用String.getByte()把字符串轉換成指定編碼。

  常用的編碼格式:ISO8859_1,這個是英文系統缺省的8bit編碼,因為是8bit的,所以不會把漢字的高位刪去,所以用它也是可以處理漢字的(我自己這麼理解,總覺得有些不妥,但又不知道不妥在何處,還望高人指出)。GB2312和GBK,漢字編碼,推薦使用GBK,它兼容GB2312並且支持更多漢字。UNICODE,一個大的字符集,不知是不是國際標准反正大家都支持,使用16位對每個字符編碼,漢字雖然正合適,但英文卻吃虧了,要用多一倍的空間來存儲,所以很多人還是老大不樂意,寫的程序不支持UNICODE。

  JSP/Servlet的中文問題有兩種解決辦法:1。不在程序中進行編碼轉換,把這個工作交給浏覽器,方法就是用javac –encoding GBK *.Java來編譯所有的bean,然後在JSP頁面上加

<%@ page contentType="text/Html;charset=gb2312" %>

以下是引用片段:
  <%@ page contentType="text/Html;charset=gb2312" %>

  或者是在Html中直接加:

  到底加那個,試試就知道了,我也搞不清楚了。

  2。在程序中指定編碼,用javac –encoding ISO8859_1 *.Java來編譯所有的bean,在涉及到中文顯示的程序上加

  str=new String(str.getBytes("ISO8859_1"));

  上面兩種方法不能混用,意思就是要麼就是GBK,要麼就是ISO8859_1,從裡到外都一樣就好了。

  數據庫JDBC的中文問題,一般只要按照數據庫指定的編碼進行轉換,比如按照ISO8859_1讀,ISO8859_1寫,一般就沒什麼問題了。

  雖然有這些編碼上的心得,但是並不能解決我的問題。看來我的程序輸入輸出用的都是ISO8859_1,我的問題跟編碼沒什麼關系。是不是字體的問題呢?在Swing的組件中,字體總是那麼幾個,基本上是定死的,選那個都不行。但是我突然發現可以更改這些字體的配置,就是font.properties 這個文件,一般JDK都帶了中文的字體配置文件,可能是font.properties.zh之類的,不同版本的JDK名字有些差別,你要做的就是用中文的配置覆蓋font.propertIEs文件。我滿心歡喜的以為成功了,但是失敗無情的又一次打擊了我。不是這種方法不對,但是在Windows系統中,Java能夠比較自動的檢查你的系統編碼,使用最合適的字體配置文件,一般不需要你改動了,在JDK1.2之前確實是要這麼改的,難怪那篇文章是JDK1.1的文檔呢。

  連font.propertIEs也不靈了,唉,是不是JBuilder有問題呀?到了這兒,我不得不懷疑它了,雖然它從沒讓我失望過,我關掉JBuilder,拿起JDK命令行,哎呀!可愛的中文竟然出來了!簡直是.....莫名其妙呀,因為JBuilder也是用的這個JDK呀?沒理由呀,我再次打開JBuilder,運行,亂碼!怪事.......我來看看.....我把JBuilder裡面的執行命令拷貝到DOS窗口裡手動執行....沒有中文.....怪怪怪,我仔細對照我手敲的命令和JBuilder拷出來的命令,除了我用的是java它用的是javaw之外,別的幾乎都一樣,難道.......這個java和Javaw竟然會不一樣?

  唉.......要我說什麼呢,答案就是這個了,javaw會使用與java不同的Local配置進行工作,導致了我一直看不到中文,而java就是好好的。JBuilder也是好好的,沒有問題,調用javaw也不是它的錯,難道你想每次運行或者調試的時候蹦出個DOS黑框麼?呵呵。這是JDK的一個Bug,我在Java的網站上查到這個bug,描述的情況跟我的一樣,然後Sun說這個Bug已經修復了,嘿嘿,簡直就是扯淡!修復個茄子!Bug編號是:4629351。不信可以去看看。

  但是難道我就不能在JBuilder裡面看我可愛的中文了嗎?好像JBuilder5的時候還能選擇是用java還是javaw,現在好像沒法兒選了。怎麼才能讓javaw支持中文呢?經過又是一番苦苦查找,竟然沒有什麼結果,郁悶!正當苦悶之時,突然想起當初配置過UNIX下的TOMCAT,好像加了些啟動參數,就能讓tomcat支持中文了,趕快翻出以前的文檔,啊,幸好我當初寫了工作心得,要不然又抓瞎了。其實道理很簡單,就是給Java虛擬機加上一些屬性:

以下是引用片段:
-Dfile.encoding=GBK -Ddefault.clIEnt.encoding=GBK -Duser.language=zh -Duser.region=CN

  把它跟在Javaw的命令行後面當參數,哈哈,搞定!

  在JBuilder中選擇Project->Project PropertIEs->run->edit->VM Parameters,填上就行了!

  配置心得:

  在JDK低版本和UNIX下,需要改動font.propertIEs,讓Java VM能夠找到合適的字體來顯示漢字。

  目前為止,Javaw有Bug,只使用英文的Local,需要給VM加上屬性才行正常顯示中文。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved