程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#入門知識 >> C#統計英文文本中的單詞數並排序

C#統計英文文本中的單詞數並排序

編輯:C#入門知識

 
思路如下:
1.使用的Hashtable(高效)集合,記錄每個單詞出現的次數
2.采用ArrayList對Hashtable中的Keys按字母序排列
3.排序使用插入排序(穩定)

public void StatisticsWords(string path) { if (!File.Exists(path)) { Console.WriteLine("文件不存在!"); return; } Hashtable ht = new Hashtable(StringComparer.OrdinalIgnoreCase); StreamReader sr = new StreamReader(path, System.Text.Encoding.UTF8); string line = sr.ReadLine(); string[] wordArr = null; int num = 0; while (line.Length > 0) { // MatchCollection mc = Regex.Matches(line, @"\b[a-z]+", RegexOptions.Compiled | RegexOptions.IgnoreCase); //foreach (Match m in mc) //{ // if (ht.ContainsKey(m.Value)) // { // num = Convert.ToInt32(ht[m.Value]) + 1; // ht[m.Value] = num; // } // else // { // ht.Add(m.Value, 1); // } //} //line = sr.ReadLine(); wordArr = line.Split(' '); foreach (string s in wordArr) { if (s.Length == 0) continue; //去除標點 line = Regex.Replace(line, @"[\p{P}*]", "", RegexOptions.Compiled); //將單詞加入哈希表 if (ht.ContainsKey(s)) { num = Convert.ToInt32(ht[s]) + 1; ht[s] = num; } else { ht.Add(s, 1); } } line = sr.ReadLine(); } ArrayList keysList = new ArrayList(ht.Keys); //對Hashtable中的Keys按字母序排列 keysList.Sort(); //按次數進行插入排序【穩定排序】,所以相同次數的單詞依舊是字母序 string tmp = String.Empty; int valueTmp = 0; for (int i = 1; i < keysList.Count; i++) { tmp = keysList[i].ToString(); valueTmp = (int)ht[keysList[i]];//次數 int j = i; while (j > 0 && valueTmp > (int)ht[keysList[j - 1]]) { keysList[j] = keysList[j - 1]; j--; } keysList[j] = tmp;//j=0 } //打印出來 foreach (object item in keysList) { Console.WriteLine((string)item + ":" + (string)ht[item]); } }

  

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved