程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#入門知識 >> 關於正則表達式的遞歸匹配問題,正則表達式遞歸匹配

關於正則表達式的遞歸匹配問題,正則表達式遞歸匹配

編輯:C#入門知識

關於正則表達式的遞歸匹配問題,正則表達式遞歸匹配


經常會有這樣的需求,要求匹配出成對的小括號裡的內容,

而一般正則表達式中的 ?R 的語法似乎在C#中不被支持, 在一番努力之下,終於找到以下一段描述

 

/(  應該是 \( 不是用 /轉義而是用 \來轉義

匹配嵌套的構造 
微軟公司已經包含了一個有趣的創新來匹配穩定的構造(歷史上,這是正則表達式所做不到的)。這並不容易掌握 — 盡管這節較短,但是注意,它非常的晦澀難懂。 
從一個例子開始可能更簡單一些,所以我用這段代碼作為開始: 
Regex r = new Regex(@"/((?>[^()]+|/((?<DEPTH>)|/)(?<-DEPTH>))*(?(DEPTH)(?!))/)"); 
這能匹配到首個完全配對的括號組,比如"before (nope (yes (here) okay) after"裡面的"(yes (here) okay)"。注意第一個左括號沒有被匹配到,因為沒有和它匹配的右括號。 
下面是它如何運作的概覽: 
1、在每個"("被匹配到的時候,"(?<DEPTH>)"在這裡加上一,告訴正則表達式系統當前括號嵌套的深度( 正則表達式開頭的"/("不包括在這裡)。 
2、在每個")"被匹配到的時候,"(?<-DEPTH>)"從深度值內減一。 
3、"(?(DEPTH)(?!))"保證在匹配最後一個右括號之前深度為零。 
它能工作的原因在於引擎的回逆堆棧保存了匹配成功的組的軌跡。"(?<DEPTH>)"不過是一個帶有名稱的分組構造,它將總是匹配成功(不匹配任何東西)。而由於它被緊接著放在"/("之後,它的成功匹配(仍然在堆棧上直到被移除)被用於左括號的計數。 
譯注:還有一種寫法是"(?<DEPTH>/()",我個人比較喜歡這種形式,而不是"/((?<DEPTH>)"。後面的"/)(?<-DEPTH>)"也是一樣。 
這樣,匹配成功了的名為"DEPTH"的分組的計數在回逆堆棧上被建立起來。而當找到右括號的時候我們還希望從深度值減一,這是由.NET特別的語法構造"(?<-DEPTH>)"實現的,它將從堆棧上移除最近匹配的"DEPTH"分組。如果堆棧上已經沒有記錄,"(?<-DEPTH>)"分組匹配失敗,從而防止了正則表達式系統匹配多余的右括號。 
最後,"(?(DEPTH)(?!))"是一個用於"(?!)"的斷言,如果"DEPTH"分組到目前為止還是成功的話。如果當我們匹配到這裡時還是成功的,這裡有個未配對的左括號還沒有被"(?<-DEPTH>)"移除。在這種情況,我們希望停止匹配(我們不希望匹配一個未配對的括號),所以我們使用"(?!)",它是一個“零寬度負預測先行斷言”,僅當子表達式不在此位置的右側匹配時才繼續匹配。 
這就是在.NET的正則表達式實現中匹配嵌套結構的方法。 

 

以上內容似乎很難懂, 其實如果覺的難懂的話也簡單,那你就不要去理解,你只要能用就OK了,把() 替換成你要的字符,相信可以解決不少你的問題,

 

以下根據這個用法寫了個測試用例

  1. private void button3_Click( object sender, EventArgs e )
  2. {
  3.        Regex r = new Regex( @"/[(?>[^/[/]]+|/[(?<DEPTH>)|/](?<-DEPTH>))*(?(DEPTH)(?!))/]" );
  4.        StringBuilder sb = new StringBuilder();
  5.        MatchString( "[111[222[333]]][222[333]][333]", r, sb );
  6.        MessageBox.Show( sb.ToString(), "取到的信息" );
  7. }
  8. private void MatchString( string OutString, Regex r, StringBuilder sb )
  9. {
  10.         MatchCollection ms = r.Matches( OutString );// 獲取所有的匹配
  11.         foreach ( Match m in ms )
  12.         {
  13.                     if ( m.Success )
  14.                     {
  15.                              sb.AppendLine( m.Groups[0].Value );
  16.                              MatchString( m.Groups[0].Value.Substring( 1, m.Groups[0].Value.Length - 1 ), r, sb );// 去掉匹配到的頭和尾的 "[" 和 "]",避免陷入死循環遞歸中,導致溢出
  17.                      }
  18.          }
  19.          return;
  20. }

可以得到

[111[222[333]]]  [222[333]]  [333]  [222[333]]  [333]  [333] 


java中的正則表達式支持遞歸匹配?

因該可以
 

問正則表達式匹配括號的問題

在正則表達式中()表示一個分組,()屬於正則表達式的特殊字符,是具有實際意義的,所以要匹配括號必須要加上 反斜槓 \( 來說明這表示的是一個普通的小括號,而不是一個正則分組
 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved