程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> .NET實例教程 >> .NET正則表達式使用高級技巧之反向引用

.NET正則表達式使用高級技巧之反向引用

編輯:.NET實例教程

反向引用,指把匹配出來的組引用到表達式本身其它地方,比如,在匹配Html的標記時,我們匹配出一個<a>,我們要把匹配出來的a引用出來,用來找到</a>,這個時候就要用到反向引用。

  語法

  a、反向引用編號的組,語法為\number

  b、反向引用命名的組,語法為\k<name>

  舉例

  a、匹配成對的Html標簽

@"<(?<tag>[^\s>]+)[^>]*>.*</\k<tag>>"

  b、匹配兩個兩個重疊出現的字符

public static void Main() 

string s = "aabbc11asd"; 
Regex reg = new Regex(@"(\w)\1"); 
MatchCollection matches = reg.Matches(s); 
foreach(Match m in matches) 
Console.WriteLine(m.Value); 
Console.ReadLine(); 

  返回結果為aa bb 11

  輔助匹配組

  以下幾種組結構,括號中的Pattern都不作為匹配結果的一部分進行保存

  1、正聲明(?=)

  涵義:括號中的模式必須出現在聲明右側,但不作為匹配的一部分

public static void Main() 

string s = "C#.net,VB.net,PHP,Java,JScript.Net"; 
Regex reg = new Regex(@"[\w\#]+(?=\.Net)",RegexOptions.Compiled); 
MatchCollection mc = reg.Matches(s); 
foreach(Match m in mc) 
Console.WriteLine(m.Value); 
Console.ReadLine(); 
//輸出 C# VB JScript 

  可以看到匹配引擎要求匹配.net,但卻不把.Net放到匹配結果中

  2、負聲明(?!)

  涵義:括號中的模式必須不出現在聲明右側

  下例演示如何取得一個<a>標簽對中的全部內容,即使其中包含別的Html tag。

public static void Main() 

string newsContent = @"url:<a href=""1.Html""><img src=""1.gif"">test<span color:red;"">Regex</span></a>."; 
Regex regEnd = new Regex(@"<\s*a[^>]*>([^<]|<(?!/a))*<\s*/a\s*>",RegexOptions.Multiline);

Console.WriteLine(regEnd.Match(newsContent).Value); 
//Result: <a href="1.Html"><img src="1.gif">test<span >Regex</span></a> 
Console.ReadLine(); 

  3、反向正聲明(?<=)

  涵義:括號中的模式必須出現在聲明左側,但不作為匹配的一部分

  4、反向負聲明(?<!)

  涵義:括號中的模式必須不出現在聲明左側

  非回溯匹配

  語法:(?>)

  涵義:該組匹配後,其匹配的字符不能通過回溯用於後面的表達式的匹配。呵呵,光看這句話肯定搞不懂,我當初為了搞懂這個也花了不少的時間,還是通過實例來說明吧: 
"www.csdn.Net" 可以通過@"\w+\.(.*)\.\w+"來匹配,卻不能通過@"\w+\.(?>.*)\.\w+"來匹配!為什麼呢?

  原因是正則匹配是貪婪的,匹配時它會盡可能多的匹配最多的結果,所以,上例兩個正則式中的.*都會把csdn.Net匹配完, 這個時候,第一個表達式在開始匹配時發現\.\w+沒得字符給它匹配了,所以它會進行回溯,所謂回溯,就是把.*匹配的結果往回推,回推留出來的字符再用來匹配\.\w+,直到\.\w+匹配成功,整個表達式返回成功的匹配結果。而第二個表達式,因使用的是非回溯匹配,所以,.*匹配完後,不允許通過回溯來匹配\.\w+,所以整個表達式匹配失敗。

  請注意,回溯匹配是很浪費資源的一種匹配方式,所以,請盡量避免您的正則式要通過回溯來成功匹配,如上例,可以換成@"\w+\.([^\.]+\.)+\w+"+"。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved