程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP函數preg_match_all正則表達式的簡單應用

PHP函數preg_match_all正則表達式的簡單應用

編輯:關於PHP編程

了解正則表達式之前,需要掌握一些常用的正則表達式的基礎知識,這些如果能記住最好記住,記不住需要用的時候能查到就行,就幾個特殊字符,所以說正則表達式玩的就是特殊,具體大家可以查看更加詳細的說明。

preg_match_all函數具體說明大家可以查看PHP手冊,本文使用preg_match_all用於測試正則表達的效果。

實例代碼

$html = '<div id="biuuu">php100</div><div id="biuuu_2">php1002</div><div id="biuuu_3">php1003</div>';

實例要求:分別將每一個DIV元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,php100,php1002和php1003(一些常用的抓站方法就是這樣匹配的)

分析:字符串是一個簡單的HTML元素,每一個DIV元素對應該一個ID和內容,並且是獨立的,首先考慮如何取出一個DIV內的ID值和內容,如:php100,然後匹配其它類似的元素。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,第一個表達式用於匹配ID值(biuuu),第二個表達式用於匹配ID的內容(php100),正則表達式常用的表達式使用小括號,那麼前面的元素將會變成如下形式:

<div id="(biuuu)">(php100)</div> <div id="(表達式1)">(表達式2)</div>

好,使用如上小括號把需要匹配的區域進行了劃分,接下來就是如何匹配各個表達式內的內容,我們猜想一個ID可能是字母,數字或下劃線,那這就變得簡單了,使用中括號就可以實現,如下:

表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數字和下劃線)

那如何匹配表達式2,因為ID的內容可以是任意的字符,但是要注意,不能匹配<或>字符,因為如果匹配這兩個字符將會把後面使用的DIV都匹配出來,因此需要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下:

表達式2:[^<>]+ (表示不匹配<和>字符)

這樣,需要匹配的子表達式就實現了,但是還要需要匹配一個

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved