程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#入門知識 >> C#漢字轉拼音(npinyin)將中文轉換成拼音全文或首字母,

C#漢字轉拼音(npinyin)將中文轉換成拼音全文或首字母,

編輯:C#入門知識

C#漢字轉拼音(npinyin)將中文轉換成拼音全文或首字母,


漢字轉拼音貌似一直是C#開發的一個難題,無論什麼方案都有一定的bug,之前使用了兩種方案。

1.Chinese2Spell.cs 一些不能識別的漢字全部轉為Z

2.Microsoft Visual Studio International Feature Pack 1.0  連"廣"、“區”都不能轉,很讓人失望。

 

Logo

這些都是2010年以前的方案,至少還有大俠在為漢字轉拼音不斷努力著,目前發現最完美的就是NPINYIN,在googlecode可以看到它的開源項目,http://code.google.com/p/npinyin/

不能識別的字很少,而且還在不斷維護更新,日趨完美,推薦大家使用。

v0.2.x的變化

  • 1、增加對不同編碼格式文本的支持,同時增加編碼轉換方法Pinyin.ConvertEncoding
  • 2、重構單字符拼音的獲取,未找到拼音時返回字符本身.

汪思言 2012年7月23日晚

將中文轉換成拼音全文和首字母的.net 組件。示例:

using System;
using System.Collections.Generic;
using System.Text;
using NPinyin;

namespace NPinyinTest
{
  class Program
  {
    static void Main(string[] args)
    {
      string[] maxims = new string[]{
        "事常與人違,事總在人為",
        "駿馬是跑出來的,強兵是打出來的",
        "駕馭命運的舵是奮斗。不抱有一絲幻想,不放棄一點機會,不停止一日努力。 ",
        "如果懼怕前面跌宕的山巖,生命就永遠只能是死水一潭", 
        "懦弱的人只會裹足不前,莽撞的人只能引為燒身,只有真正勇敢的人才能所向披靡"
      };

      string[] medicines = new string[] {
        "聚維酮碘溶液",
        "開塞露",
        "爐甘石洗劑",
        "苯扎氯铵貼",
        "魚石脂軟膏",
        "莫匹羅星軟膏",
        "紅霉素軟膏",
        "氫化可的松軟膏",
        "曲安奈德軟膏",
        "丁苯羟酸乳膏",
        "雙氯芬酸二乙胺乳膏",
        "凍瘡膏",
        "克霉唑軟膏",
        "特比奈芬軟膏",
        "酞丁安軟膏",
        "咪康唑軟膏、栓劑",
        "甲硝唑栓",
        "復方莪術油栓"
      };

      Console.WriteLine("UTF8句子拼音:");
      foreach (string s in maxims)
      {
        Console.WriteLine("漢字:{0}\n拼音:{1}\n", s, Pinyin.GetPinyin(s));
      }

      Encoding gb2312 = Encoding.GetEncoding("GB2312");
      Console.WriteLine("GB2312拼音簡碼:");
      foreach (string m in medicines)
      {
        string s = Pinyin.ConvertEncoding(m, Encoding.UTF8, gb2312);
        Console.WriteLine("藥品:{0}\n簡碼:{1}\n", s, Pinyin.GetInitials(s, gb2312));
      }

      Console.ReadKey();
    }
  }
}

運行結果

UTF8句子拼音: 漢字:事常與人違,事總在人為 拼音:shi chang yu ren wei , shi zong zai ren wei

漢字:駿馬是跑出來的,強兵是打出來的 拼音:jun ma shi pao chu lai de , qiang bing shi da chu lai de

漢字:駕馭命運的舵是奮斗。不抱有一絲幻想,不放棄一點機會,不停止一日努力。 拼音:jia yu ming yun de duo shi fen dou 。 bu bao you yi si huan xiang , bu fa ng qi yi dian ji hui , bu ting zhi yi ri nu li 。

漢字:如果懼怕前面跌宕的山巖,生命就永遠只能是死水一潭 拼音:ru guo ju pa qian mian die dang de shan yan , sheng ming jiu yong yuan zh i neng shi si shui yi tan

漢字:懦弱的人只會裹足不前,莽撞的人只能引為燒身,只有真正勇敢的人才能所向披靡 拼音:nuo ruo de ren zhi hui guo zu bu qian , mang zhuang de ren zhi neng yin w ei shao shen , zhi you zhen zheng yong gan de ren cai neng suo xiang pi mi

GB2312拼音簡碼: 藥品:聚維酮碘溶液 簡碼:JWTDRY

藥品:開塞露 簡碼:KSL

藥品:爐甘石洗劑 簡碼:LGSXJ

藥品:苯扎氯铵貼 簡碼:BZLAT

藥品:魚石脂軟膏 簡碼:YSZRG

藥品:莫匹羅星軟膏 簡碼:MPLXRG

藥品:紅霉素軟膏 簡碼:HMSRG

藥品:氫化可的松軟膏 簡碼:QHKDSRG

藥品:曲安奈德軟膏 簡碼:QANDRG

藥品:丁苯羟酸乳膏 簡碼:DBQSRG

藥品:雙氯芬酸二乙胺乳膏 簡碼:SLFSEYARG

藥品:凍瘡膏 簡碼:DCG

藥品:克霉唑軟膏 簡碼:KMZRG

藥品:特比奈芬軟膏 簡碼:TBNFRG

藥品:酞丁安軟膏 簡碼:TDARG

藥品:咪康唑軟膏、栓劑 簡碼:MKZRG、SJ

藥品:甲硝唑栓 簡碼:JXZS

藥品:復方莪術油栓 簡碼:FFESYS


C語言中->是什?

->是一個整體,它是用於指向結構體、C++中的class等含有子數據的指針用來取子數據。換種說法,如果我們在C語言中定義了一個結構體,然後申明一個指針指向這個結構體,那麼我們要用指針取出結構體中的數據,就要用到“->”.
舉個例子:
struct Data
{
int a,b,c;
}; /*定義結構體*/
struct Data * p;/*定義結構體指針*/
struct Data A = {1,2,3};/*聲明變量A*/
int x;/*聲明一個變量x*/
p = &A ; /*讓p指向A*/
x = p->a;/*這句話的意思就是取出p所指向的結構體中包含的數據項a賦值給x*/
/*由於此時p指向A,因而 p->a == A.a,也就是1*/

對於一開始的問題 p = p->next;這應該出現在C語言的鏈表,這裡的next應該是一個與p同類型的結構體指針,其定義格式應該是:
struct Data
{
int a;
struct Data * next;
};/*定義結構體*/
…………
main()
{
struct Data * p;/*聲明指針變量p*/
……
p = p->next;/*將next中的值賦給p*/
}
鏈表指針是C語言的一個難點,但也是重點,學懂了非常有用。要仔細講就必須先講變量、指針。
什麼是變量?所謂變量,不要淺顯的認為會變得量就是變量。套用我們院長的問話:“教室變不變?”變,因為每天有不同的人在裡面上課,但又不變,因為教室始終在那,沒有變大或變小。這就是變量:有一個不變的地址和一塊可變的存儲空間。正常情況下,我們只看到變量這個房間裡面的東西,也就是其內容,但不會關注變量的地址,但是C語言的指針,就是這個房間的地址。我們聲明變量就相當於蓋了間房子存放東西,我們可以直接觀看房子裡的東西,而聲明指針,就是相當於獲得了一個定位器,當用指針指向某個變量時,就是用指針給變量定位,以後我們就可以用指針找到他所“跟蹤”的變量並可以獲得裡面的內容。
那結構體呢?結構體就相當於是有好幾個房子組成的別墅,幾個房子綁定在一起使用。假設現在有很多這種別墅分布在一個大迷宮裡,每間別墅裡都有一間房子。裡面放了另一個別墅的位置信息,現在你手拿定位器找到了第一棟別墅,從裡面得到了你想要的東西(鏈表的數據部分),然後把下一棟別墅的位置計入你的定位器(p = p->next),再走向下一棟別墅……如此走下去,知道走到某地下一棟別墅信息沒有了(p->next == NULL),你的旅行結束。這就是鏈表一次遍歷的過程。現在你能明白 p=p->next的含義了吧!
寫了這麼多。希望你能明白。
如果想學好c和C++,鏈表和指針必須熟練掌握!
 

C語言中->是什?

->是一個整體,它是用於指向結構體、C++中的class等含有子數據的指針用來取子數據。換種說法,如果我們在C語言中定義了一個結構體,然後申明一個指針指向這個結構體,那麼我們要用指針取出結構體中的數據,就要用到“->”.
舉個例子:
struct Data
{
int a,b,c;
}; /*定義結構體*/
struct Data * p;/*定義結構體指針*/
struct Data A = {1,2,3};/*聲明變量A*/
int x;/*聲明一個變量x*/
p = &A ; /*讓p指向A*/
x = p->a;/*這句話的意思就是取出p所指向的結構體中包含的數據項a賦值給x*/
/*由於此時p指向A,因而 p->a == A.a,也就是1*/

對於一開始的問題 p = p->next;這應該出現在C語言的鏈表,這裡的next應該是一個與p同類型的結構體指針,其定義格式應該是:
struct Data
{
int a;
struct Data * next;
};/*定義結構體*/
…………
main()
{
struct Data * p;/*聲明指針變量p*/
……
p = p->next;/*將next中的值賦給p*/
}
鏈表指針是C語言的一個難點,但也是重點,學懂了非常有用。要仔細講就必須先講變量、指針。
什麼是變量?所謂變量,不要淺顯的認為會變得量就是變量。套用我們院長的問話:“教室變不變?”變,因為每天有不同的人在裡面上課,但又不變,因為教室始終在那,沒有變大或變小。這就是變量:有一個不變的地址和一塊可變的存儲空間。正常情況下,我們只看到變量這個房間裡面的東西,也就是其內容,但不會關注變量的地址,但是C語言的指針,就是這個房間的地址。我們聲明變量就相當於蓋了間房子存放東西,我們可以直接觀看房子裡的東西,而聲明指針,就是相當於獲得了一個定位器,當用指針指向某個變量時,就是用指針給變量定位,以後我們就可以用指針找到他所“跟蹤”的變量並可以獲得裡面的內容。
那結構體呢?結構體就相當於是有好幾個房子組成的別墅,幾個房子綁定在一起使用。假設現在有很多這種別墅分布在一個大迷宮裡,每間別墅裡都有一間房子。裡面放了另一個別墅的位置信息,現在你手拿定位器找到了第一棟別墅,從裡面得到了你想要的東西(鏈表的數據部分),然後把下一棟別墅的位置計入你的定位器(p = p->next),再走向下一棟別墅……如此走下去,知道走到某地下一棟別墅信息沒有了(p->next == NULL),你的旅行結束。這就是鏈表一次遍歷的過程。現在你能明白 p=p->next的含義了吧!
寫了這麼多。希望你能明白。
如果想學好c和C++,鏈表和指針必須熟練掌握!
 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved