萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> 編程語言綜合 >> C#實現的字符串相似度對比類

C#實現的字符串相似度對比類

   本類適用於比較2個字符的相似度,代碼如下:

  ?

        using System;

  using System.Collections.Generic;

  using System.Text;

  public class StringCompute

  {

  #region 私有變量

  ///

  /// 字符串1

  ///

  private char[] _ArrChar1;

  ///

  /// 字符串2

  ///

  private char[] _ArrChar2;

  ///

  /// 統計結果

  ///

  private Result _Result;

  ///

  /// 開始時間

  ///

  private DateTime _BeginTime;

  ///

  /// 結束時間

  ///

  private DateTime _EndTime;

  ///

  /// 計算次數

  ///

  private int _ComputeTimes;

  ///

  /// 算法矩陣

  ///

  private int[,] _Matrix;

  ///

  /// 矩陣列數

  ///

  private int _Column;

  ///

  /// 矩陣行數

  ///

  private int _Row;

  #endregion

  #region 屬性

  public Result ComputeResult

  {

  get { return _Result; }

  }

  #endregion

  #region 構造函數

  public StringCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  }

  public StringCompute()

  {

  }

  #endregion

  #region 算法實現

  ///

  /// 初始化算法基本信息

  ///

  /// 字符串1

  /// 字符串2

  private void StringComputeInit(string str1, string str2)

  {

  _ArrChar1 = str1.ToCharArray();

  _ArrChar2 = str2.ToCharArray();

  _Result = new Result();

  _ComputeTimes = 0;

  _Row = _ArrChar1.Length + 1;

  _Column = _ArrChar2.Length + 1;

  _Matrix = new int[_Row, _Column];

  }

  ///

  /// 計算相似度

  ///

  public void Compute()

  {

  //開始時間

  _BeginTime = DateTime.Now;

  //初始化矩陣的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //關鍵步驟,計算當前位置值為左邊+1、上面+1、左上角+intCost中的最小值

  //循環遍歷到最後_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //結束時間

  _EndTime = DateTime.Now;

  //相似率 移動次數小於最長的字符串長度的20%算同一題

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 計算相似度(不記錄比較時間)

  ///

  public void SpeedyCompute()

  {

  //開始時間

  //_BeginTime = DateTime.Now;

  //初始化矩陣的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //關鍵步驟,計算當前位置值為左邊+1、上面+1、左上角+intCost中的最小值

  //循環遍歷到最後_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //結束時間

  //_EndTime = DateTime.Now;

  //相似率 移動次數小於最長的字符串長度的20%算同一題

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  // _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 計算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void Compute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.Compute();

  }

  ///

  /// 計算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void SpeedyCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.SpeedyCompute();

  }

  ///

  /// 初始化矩陣的第一行和第一列

  ///

  private void InitMatrix()

  {

  for (int i = 0; i < _Column; i++)

  {

  _Matrix[0, i] = i;

  }

  for (int i = 0; i < _Row; i++)

  {

  _Matrix[i, 0] = i;

  }

  }

  ///

  /// 取三個數中的最小值

  ///

  ///

  ///

  ///

  ///

  private int Minimum(int First, int Second, int Third)

  {

  int intMin = First;

  if (Second < intMin)

  {

  intMin = Second;

  }

  if (Third < intMin)

  {

  intMin = Third;

  }

  return intMin;

  }

  #endregion

  }

  ///

  /// 計算結果

  ///

  public struct Result

  {

  ///

  /// 相似度

  ///

  public decimal Rate;

  ///

  /// 對比次數

  ///

  public string ComputeTimes;

  ///

  /// 使用時間

  ///

  public string UseTime;

  ///

  /// 差異

  ///

  public int Difference;

  }

  調用方法:

  ?

       // 方式一

  StringCompute stringcompute1 = new StringCompute();

  stringcompute1.SpeedyCompute("對比字符一", "對比字符二"); // 計算相似度, 不記錄比較時間

  decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之幾,完全匹配相似度為1

  // 方式二

  StringCompute stringcompute2 = new StringCompute();

  stringcompute2.Compute(); // 計算相似度, 記錄比較時間

  string usetime = stringcompute2.ComputeResult.UseTime; // 對比使用時間

copyright © 萬盛學電腦網 all rights reserved