程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> ASP編程 >> ASP入門教程 >> 一些常用的正則表達式大全

一些常用的正則表達式大全

編輯:ASP入門教程

匹配中文字符的正則表達式
 程序代碼
[\u4e00-\u9fa5]

評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了

匹配雙字節字符(包括漢字在內):
 程序代碼
[^\x00-\xff]

評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)

匹配空白行的正則表達式:
 程序代碼
\n\s*\r

評注:可以用來刪除空白行

匹配Html標記的正則表達式:
 程序代碼
<(\S*?)[^>]*>.*?|<.*? />

評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於復雜的嵌套標記依舊無能為力

匹配首尾空白字符的正則表達式:
 程序代碼
^\s*|\s*$

評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式

匹配Email地址的正則表達式:
 程序代碼
\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

評注:表單驗證時很實用

匹配網址URL的正則表達式:
 程序代碼
[a-zA-z]+://[^\s]*

評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求


匹配二級或多級域名的主域名
([a-z0-9][a-z0-9\-]*?\.(?:com|cn|net|org|gov|info|la|cc|co)(?:\.(?:cn|jp))?)$

匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):
 程序代碼
^[a-zA-Z][a-zA-Z0-9_]{4,15}$

評注:表單驗證時很實用

匹配國內電話號碼:
 程序代碼
\d{3}-\d{8}|\d{4}-\d{7}

評注:匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號:
 程序代碼
[1-9][0-9]{4,}

評注:騰訊QQ號從10000開始

匹配中國郵政編碼:
 程序代碼
[1-9]\d{5}(?!\d)

評注:中國郵政編碼為6位數字

匹配身份證:
 程序代碼
\d{15}|\d{18}

評注:中國的身份證為15位或18位

匹配ip地址:
 程序代碼
\d+\.\d+\.\d+\.\d+

評注:提取ip地址時有用

匹配特定數字:

 程序代碼
^[1-9]\d*$    //匹配正整數
^-[1-9]\d*$   //匹配負整數
^-?[1-9]\d*$   //匹配整數
^[1-9]\d*|0$  //匹配非負整數(正整數 + 0)
^-[1-9]\d*|0$   //匹配非正整數(負整數 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非負浮點數(正浮點數 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮點數(負浮點數 + 0)

評注:處理大量數據時有用,具體應用時注意修正

匹配特定字符串:

 程序代碼
^[A-Za-z]+$  //匹配由26個英文字母組成的字符串
^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串
^\w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串


在使用 RegularExpressionValidator 驗證控件時的驗證功能及其驗證表達式介紹如下:

只能輸入數字:
 程序代碼
^[0-9]*$

只能輸入n位的數字:
 程序代碼
^\d{n}$

只能輸入至少n位數字:
 程序代碼
^\d{n,}$

只能輸入m-n位的數字:
 程序代碼
^\d{m,n}$

只能輸入零和非零開頭的數字:
 程序代碼
^(0|[1-9][0-9]*)$

只能輸入有兩位小數的正實數:
 程序代碼
^[0-9]+(.[0-9]{2})?$

只能輸入有1-3位小數的正實數:
 程序代碼
^[0-9]+(.[0-9]{1,3})?$

只能輸入非零的正整數:
 程序代碼
^\+?[1-9][0-9]*$

只能輸入非零的負整數:
 程序代碼
^\-[1-9][0-9]*$

只能輸入長度為3的字符:
 程序代碼
^.{3}$

只能輸入由26個英文字母組成的字符串:
 程序代碼
^[A-Za-z]+$

只能輸入由26個大寫英文字母組成的字符串:
 程序代碼
^[A-Z]+$

只能輸入由26個小寫英文字母組成的字符串:
 程序代碼
^[a-z]+$

只能輸入由數字和26個英文字母組成的字符串:
 程序代碼
^[A-Za-z0-9]+$

只能輸入由數字、26個英文字母或者下劃線組成的字符串:
 程序代碼
^\w+$

只能輸入漢字:
 程序代碼
^[\u4e00-\u9fa5],{0,}$

驗證用戶密碼:
 程序代碼
^[a-zA-Z]\w{5,17}$

正確格式為:以字母開頭,長度在6-18之間,只能包含字符、數字和下劃線。
驗證是否含有^%&',;=?$\等字符:
 程序代碼
[^%&',;=?$\x22]+

驗證Email地址:
 程序代碼
^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

驗證InternetURL:
 程序代碼
^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

驗證電話號碼:
 程序代碼
^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$

正確格式為:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX, XXX-XXXXXXXX,XXXXXXX,XXXXXXXX
驗證身份證號(15位或18位數字):
 程序代碼
^\d{15}|\d{}18$

驗證一年的12個月:
 程序代碼
^(0?[1-9]|1[0-2])$

正確格式為:01-09和112
驗證一個月的31天:
 程序代碼
^((0?[1-9])|((1|2)[0-9])|30|31)$

正確格式為:0109和131-----------------------常用的匹配正則表達式和實例--------------------------------

匹配中文字符的正則表達式:
 程序代碼
[\u4e00-\u9fa5]


匹配雙字節字符(包括漢字在內):
 程序代碼
[^\x00-\xff]


應用:計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)


 程序代碼
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}


匹配空行的正則表達式:
 程序代碼
\n[\s| ]*\r


匹配Html標記的正則表達式:
 程序代碼
/<(.*)>.*<\/\1>|<(.*) \/>/


匹配首尾空格的正則表達式:
 程序代碼
(^\s*)|(\s*$)


應用:Javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實現,如下:


 程序代碼
String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}


利用正則表達式分解和轉換IP地址:

下面是利用正則表達式匹配IP地址,並將IP地址轉換成對應數值的Javascript程序:


 程序代碼
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}


不過上面的程序如果不用正則表達式,而直接用split函數來分解可能更簡單,程序如下:
http://bizhi.knowsky.com/

 程序代碼
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))


匹配Email地址的正則表達式:
 程序代碼
\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*


匹配網址URL的正則表達式:
 程序代碼
http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?


匹配區號、分機號的固定電話正則表達式:
 程序代碼
/^((0\d{2,3})-)(\d{7,8})(-(\d{3,}))?$/


手機號碼前面以1開頭,第二位現在是3或者5,後面是9位數字,則:
 程序代碼
/^1[35]\d{9}$/


更強悍的固定電話號碼正則表達式:
 程序代碼
(^(\d{2,4}[-_-—]?)?\d{3,8}([-_-—]?\d{3,8})?([-_-—]?\d{1,7})?$)|(^0?1[35]\d{9}$)

該表達式可以驗證那些不小心把連接符“-”寫出“-”的或者下劃線“_”的等等。

利用正則表達式去除字串中重復的字符的算法程序:[注:此程序不正確,原因見本貼回復]


 程序代碼
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi


我原來在CSDN上發貼尋求一個表達式來實現去除重復字符的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重復的字符,再以重復的字符建立第二個表達式,取到不重復的字符,兩者串連。這個方法對於字符順序有要求的字符串可能不適用。

得用正則表達式從URL地址中提取文件名的Javascript程序,如下結果為page1


 程序代碼
s="http://www.9499.Net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)


利用正則表達式限制網頁表單裡的文本框輸入內容:

用正則表達式限制只能輸入中文:
 程序代碼
onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,)" onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\u4E00-\u9FA5]/g,))"


用正則表達式限制只能輸入全角字符:
 程序代碼
onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,)" onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\uFF00-\uFFFF]/g,))"


用正則表達式限制只能輸入數字:
 程序代碼
onkeyup="value=value.replace(/[^\d]/g,) "onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\d]/g,))"


用正則表達式限制只能輸入數字和英文:
 程序代碼
onkeyup="value=value.replace(/[\W]/g,) "onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\d]/g,))"

 

 程序代碼
^\d+$  //匹配非負整數(正整數 + 0)
^[0-9]*[1-9][0-9]*$  //匹配正整數
^((-\d+)|(0+))$  //匹配非正整數(負整數 + 0)
^-[0-9]*[1-9][0-9]*$  //匹配負整數
^-?\d+$    //匹配整數
^\d+(\.\d+)?$  //匹配非負浮點數(正浮點數 + 0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮點數
^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //匹配非正浮點數(負浮點數 + 0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配負浮點數
^(-?\d+)(\.\d+)?$  //匹配浮點數
^[A-Za-z]+$  //匹配由26個英文字母組成的字符串
^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串
^\w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url


------------------------------------
利用正則表達式去除字串中重復的字符的算法程序:


 程序代碼
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi

===============================
如果var s = "abacabefggeeii"
結果就不對了,結果為:abeicfgg
正則表達式的能力有限
----------------------------------------------------------

 程序代碼
Function Extension(url As String) As String
Dim r As New Regex("^(?<proto>\w+)://[^/]+?(?<port>:\d+)?/", _
RegexOptions.Compiled)
Return r.Match(url).Result("${proto}${port}")
End Function


20090701更新:

超強悍的IP地址驗證正則表達式:

 程序代碼
^(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5])$


支持n級域名判斷的正則表達式:

 程序代碼
^(([^-][a-z0-9A-Z-_]+\.)*)[^-][a-z0-9A-Z-_]+(\.[a-zA-Z]{2,4}){1,2}$


二級域名正則表達式 分析+分割 URL的正則表達式:

 程序代碼
(\w+:\/\/)?([^\.]+)(\.[^/:]+)(:\d*)?([^# ]*)


第一個附加子表達式($1)是用來捕獲該 web 地址的協議部分。該子表達式匹配位於包括一個冒號和兩個正斜槓之前的任何單詞。
第二個附加子表達式($2)捕獲該地址的二級域名地址。該子表達式匹配不包括 '.' 字符的任何字符序列。
第三個附加子表達式($3)捕獲該地址的域名地址。該子表達式匹配不包括 '/' 或 ':' 字符的任何字符序列。
第四個附加子表達式($4)捕獲網站端口號碼,如果指定了該端口號。該子表達式匹配後跟一個冒號的零或多個數字。
第五個附加子表達式($5)捕獲由該 web 地址指定的路徑以及\或者頁面信息。該子表達式匹配一個和多個除'#' 或空格之外的字符。

將該正則表達式應用於http://www.dlstu.cn:80/code/default.ASP?id=1056所示的URI 後,子匹配包含如下內容:
RegExp.$0 包含 "http://www.dlstu.cn:80/code/default.ASP?id=1056"
RegExp.$1 包含 "http://"
RegExp.$2 包含 "www"
RegExp.$3 包含 ".dlstu.cn"
RegExp.$4 包含 ":80"
RegExp.$5 包含 "/code/default.ASP?id=1056"

超強悍的URL網址驗證正則表達式,幾乎可以匹配目前所有的常見網址協議,可以擴充更多以支持其他下載協議等:

 程序代碼
^((https|http|FTP|rtsp|mms)?://)?(([0-9a-z_!~*'().&=+$%-]+: )?[0-9a-zA-Z_!~*'().&=+$%-]+@)?(([0-9]{1,3}\.){3}[0-9]{1,3}|([0-9a-zA-Z_!~*'()-]+\.)*([0-9a-zA-Z][0-9a-zA-Z-]{0,61})?[0-9a-z]\.[a-zA-Z]{2,6})(:[0-9]{1,4})?((/?)|(/[0-9a-zA-Z_!~*'().;?:@&=+$,%#-]+)+/?)$

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved