程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> ASP編程 >> ASP入門教程 >> 正則表達式簡介(11)

正則表達式簡介(11)

編輯:ASP入門教程
11.限定符

有時候不知道要匹配多少字符。為了能適應這種不確定性,正則表達式支持限定符的概念。這些限定符可以指定正則表達
式的一個給定組件必須要出現多少次才能滿足匹配。

下表給出了各種限定符及其含義的說明:

字符                                       描述 

*     匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。
       * 等價於{0,}。 

+      匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以
        及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。 

?      匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 
        或 "does" 中的"do" 。? 等價於 {0,1}。 

{n}    n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 
        中的 'o',但是能匹配 "food" 中的兩個 o。

{n,}   n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中 
        的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+'。'o
        {0,}' 則等價於 'o*'。 

{n,m}  m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。 
        劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價
        於 'o?'。請注意在逗號和兩個數之間不能有空格。 


對一個很大的輸入文檔而言,章節數很輕易就超過九章,因此需要有一種方法來處理兩位數或者三位數的章節號。限定符
就提供了這個功能。下面的Visual Basic Scripting Edition 正則表達式可以匹配具有任何位數的章節標題:

/Chapter [1-9][0-9]*/

下面的 VBScript 正則表達式執行同樣的匹配:

"Chapter [1-9][0-9]*"

請注意限定符出現在范圍表達式之後。因此,它將應用於所包含的整個范圍表達式,在本例中,只指定了從 0 到 9 的數
字。

這裡沒有使用 '+' 限定符,因為第二位或後續位置上並不一定需要一個數字。同樣也沒有使用 '?' 字符,因為這將把章
節數限制為只有兩位數字。在 'Chapter' 和空格字符之後至少要匹配一個數字。

如果已知章節數限制只有99 章,則可以使用下面的 Visual Basic Scripting Edition 表達式來指定至少有一位數字,但
不超過兩個數字。

/Chapter [0-9]{1,2}/

對 VBScript 可以使用下述正則表達式:

"Chapter [0-9]{1,2}"

上述表達式的缺點是如果有一個章節號大於 99,它仍只會匹配前兩位數字。另一個缺點是某些人可以創建一個 Chapter 
0,而且仍能匹配。一個更好的用來匹配兩位數的 Visual Basic Scripting Edition 表達式如下:

/Chapter [1-9][0-9]?/

或者

/Chapter [1-9][0-9]{0,1}/

對 VBScript 而言,下述表達式與上面等價:

"Chapter [1-9][0-9]?"

或者

"Chapter [1-9][0-9]{0,1}"

'*'、 '+'和 '?' 限定符都稱之為貪婪的,也就是說,他們盡可能多地匹配文字。有時這根本就不是所希望發生的情況。
有時則正好希望最小匹配。 

例如,你可能要搜索一個 Html 文檔來查找一處包含在 H1 標記中的章節標題。在文檔中該文字可能具有如下形式:

<H1>Chapter 1 – Introduction to Regular ExPRessions</H1>

下面的表達式匹配從開始的小於號 (<) 到 H1 標記結束處的大於號之間的所有內容。

/<.*>/

VBScript 的正則表達式為:

"<.*>"

如果所要匹配的就是開始的 H1 標記,則下述非貪婪地表達式就只匹配 <H1>。

/<.*?>/

或者

"<.*?>"

通過在 '*'、 '+' 或 '?' 限定符後放置 '?',該表達式就從貪婪匹配轉為了非貪婪或最小匹配。
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved