程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> 更多關於編程 >> C#實現的字符串相似度對比類

C#實現的字符串相似度對比類

編輯:更多關於編程

       本類適用於比較2個字符的相似度,代碼如下:

      ?

            using System;

      using System.Collections.Generic;

      using System.Text;

      public class StringCompute

      {

      #region 私有變量

      ///

      /// 字符串1

      ///

      private char[] _ArrChar1;

      ///

      /// 字符串2

      ///

      private char[] _ArrChar2;

      ///

      /// 統計結果

      ///

      private Result _Result;

      ///

      /// 開始時間

      ///

      private DateTime _BeginTime;

      ///

      /// 結束時間

      ///

      private DateTime _EndTime;

      ///

      /// 計算次數

      ///

      private int _ComputeTimes;

      ///

      /// 算法矩陣

      ///

      private int[,] _Matrix;

      ///

      /// 矩陣列數

      ///

      private int _Column;

      ///

      /// 矩陣行數

      ///

      private int _Row;

      #endregion

      #region 屬性

      public Result ComputeResult

      {

      get { return _Result; }

      }

      #endregion

      #region 構造函數

      public StringCompute(string str1, string str2)

      {

      this.StringComputeInit(str1, str2);

      }

      public StringCompute()

      {

      }

      #endregion

      #region 算法實現

      ///

      /// 初始化算法基本信息

      ///

      /// 字符串1

      /// 字符串2

      private void StringComputeInit(string str1, string str2)

      {

      _ArrChar1 = str1.ToCharArray();

      _ArrChar2 = str2.ToCharArray();

      _Result = new Result();

      _ComputeTimes = 0;

      _Row = _ArrChar1.Length + 1;

      _Column = _ArrChar2.Length + 1;

      _Matrix = new int[_Row, _Column];

      }

      ///

      /// 計算相似度

      ///

      public void Compute()

      {

      //開始時間

      _BeginTime = DateTime.Now;

      //初始化矩陣的第一行和第一列

      this.InitMatrix();

      int intCost = 0;

      for (int i = 1; i < _Row; i++)

      {

      for (int j = 1; j < _Column; j++)

      {

      if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

      {

      intCost = 0;

      }

      else

      {

      intCost = 1;

      }

      //關鍵步驟,計算當前位置值為左邊+1、上面+1、左上角+intCost中的最小值

      //循環遍歷到最後_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離

      _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

      _ComputeTimes++;

      }

      }

      //結束時間

      _EndTime = DateTime.Now;

      //相似率 移動次數小於最長的字符串長度的20%算同一題

      int intLength = _Row > _Column ? _Row : _Column;

      _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

      _Result.UseTime = (_EndTime - _BeginTime).ToString();

      _Result.ComputeTimes = _ComputeTimes.ToString();

      _Result.Difference = _Matrix[_Row - 1, _Column - 1];

      }

      ///

      /// 計算相似度(不記錄比較時間)

      ///

      public void SpeedyCompute()

      {

      //開始時間

      //_BeginTime = DateTime.Now;

      //初始化矩陣的第一行和第一列

      this.InitMatrix();

      int intCost = 0;

      for (int i = 1; i < _Row; i++)

      {

      for (int j = 1; j < _Column; j++)

      {

      if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

      {

      intCost = 0;

      }

      else

      {

      intCost = 1;

      }

      //關鍵步驟,計算當前位置值為左邊+1、上面+1、左上角+intCost中的最小值

      //循環遍歷到最後_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離

      _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

      _ComputeTimes++;

      }

      }

      //結束時間

      //_EndTime = DateTime.Now;

      //相似率 移動次數小於最長的字符串長度的20%算同一題

      int intLength = _Row > _Column ? _Row : _Column;

      _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

      // _Result.UseTime = (_EndTime - _BeginTime).ToString();

      _Result.ComputeTimes = _ComputeTimes.ToString();

      _Result.Difference = _Matrix[_Row - 1, _Column - 1];

      }

      ///

      /// 計算相似度

      ///

      /// 字符串1

      /// 字符串2

      public void Compute(string str1, string str2)

      {

      this.StringComputeInit(str1, str2);

      this.Compute();

      }

      ///

      /// 計算相似度

      ///

      /// 字符串1

      /// 字符串2

      public void SpeedyCompute(string str1, string str2)

      {

      this.StringComputeInit(str1, str2);

      this.SpeedyCompute();

      }

      ///

      /// 初始化矩陣的第一行和第一列

      ///

      private void InitMatrix()

      {

      for (int i = 0; i < _Column; i++)

      {

      _Matrix[0, i] = i;

      }

      for (int i = 0; i < _Row; i++)

      {

      _Matrix[i, 0] = i;

      }

      }

      ///

      /// 取三個數中的最小值

      ///

      ///

      ///

      ///

      ///

      private int Minimum(int First, int Second, int Third)

      {

      int intMin = First;

      if (Second < intMin)

      {

      intMin = Second;

      }

      if (Third < intMin)

      {

      intMin = Third;

      }

      return intMin;

      }

      #endregion

      }

      ///

      /// 計算結果

      ///

      public struct Result

      {

      ///

      /// 相似度

      ///

      public decimal Rate;

      ///

      /// 對比次數

      ///

      public string ComputeTimes;

      ///

      /// 使用時間

      ///

      public string UseTime;

      ///

      /// 差異

      ///

      public int Difference;

      }

      調用方法:

      ?

           // 方式一

      StringCompute stringcompute1 = new StringCompute();

      stringcompute1.SpeedyCompute("對比字符一", "對比字符二"); // 計算相似度, 不記錄比較時間

      decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之幾,完全匹配相似度為1

      // 方式二

      StringCompute stringcompute2 = new StringCompute();

      stringcompute2.Compute(); // 計算相似度, 記錄比較時間

      string usetime = stringcompute2.ComputeResult.UseTime; // 對比使用時間

    1. 上一頁:
    2. 下一頁:
    Copyright © 程式師世界 All Rights Reserved