程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> 關於.NET >> .NET開發時使用正則表達式的BUG

.NET開發時使用正則表達式的BUG

編輯:關於.NET

又發現了一個 .Net 的bug!最近在使用正則表達式的時候發現:在忽略大小寫的時候,匹配值從 0xff 到 0xffff 之間的所有字符,正則表達式竟然也能匹配兩個 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和數字。

比如以下的代碼就是用來測試用正則表達式匹配從 0xff 到 0xffff 的字符。而值范圍在 0 到 0xfe 的所有字符是不能被匹配的。

  1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+"); 
  // The characters, whoes value are smaller than 0xff, are not expected to be matched. 
  for (int i = 0; i < 0xff; i++) { 
  string s = new string(new char[] { (char)i }); 
  Debug.Assert( 
  !regex.IsMatch(s), 
  string.Format("The character was not expected to be matched: 0x{0:X}!", i)); 
  } 
  // However, the characters whoes value are greater than 0xfe are expected to be matched. 
  for (int i = 0xff; i <= 0xffff; i++) { 
  string s = new string(new char[] { (char)i }); 
  Debug.Assert( 
  regex.IsMatch(s), 
  string.Format("The character was expected to be matched: 0x{0:X}!", i)); 
  }

這時的運行結果是正常的,沒有任何的斷言錯誤出現。

然而當使用忽略大小寫的匹配模式時,結果就不一樣了。將上面代碼中的第一行改成:

1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);

程序運行的時候就會有兩處斷言錯誤。它們分別是字符值為 73 和 105,也就是小寫字母 i 和大寫字母 I。 這個 bug 非常奇怪,別的字符都很正常!而且用 Javascript 腳本在 IE (版本是6.0)裡面運行也同樣有這麼 bug 存在(比如下面這段代碼)。然而在 Firefox 中運行就是沒有問題的。還是 Firefox 好啊,呵呵!

1234567891011121314151617var re = /[/u00FF-/uFFFF]+/; 
  // var re = /[/u00FF-/uFFFF]+/i; 
  for(var i=0; i<0xff; i++) { 
  var s = String.fromCharCode( i ); 
  if ( re.test(s) ){ 
  alert( 'Should not be matched: ' + i + '!' ); 
  } 
  } 
  for(var i=0xff; i<=0xffff; i++) { 
  var s = String.fromCharCode( i ); 
  if ( !re.test(s) ){ 
  alert( 'Should be matched: ' + i + '!' ); 
  } 
  }
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved