程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> php小經驗:解析preg_match與preg_match_all 函數

php小經驗:解析preg_match與preg_match_all 函數

編輯:關於PHP編程

    正則表達式在 PHP 中的應用
    在 PHP 應用中,正則表達式主要用於:
    •正則匹配:根據正則表達式匹配相應的內容
    •正則替換:根據正則表達式匹配內容並替換
    •正則分割:根據正則表達式分割字符串
    在 PHP 中有兩類正則表達式函數,一類是 Perl 兼容正則表達式函數,一類是 POSIX 擴展正則表達式函數。二者差別不大,而且推薦使用Perl 兼容正則表達式函數,因此下文都是以 Perl 兼容正則表達式函數為例子說明。
    定界符
    Perl 兼容模式的正則表達式函數,其正則表達式需要寫在定界符中。任何不是字母、數字或反斜線()的字符都可以作為定界符,通常我們使用 / 作為定界符。具體使用見下面的例子。
    提示
    盡管正則表達式功能非常強大,但如果用普通字符串處理函數能完成的,就盡量不要用正則表達式函數,因為正則表達式效率會低得多。關於普通字符串處理函數。
    preg_match()
    preg_match() 函數用於進行正則表達式匹配,成功返回 1 ,否則返回 0 。
    語法:
    int preg_match( string pattern, string subject [, array matches ] )
    參數說明:

    參數 說明 pattern 正則表達式 subject 需要匹配檢索的對象 matches 可選,存儲匹配結果的數組, $matches[0] 將包含與整個模式匹配的文本,$matches[1] 將包含與第一個捕獲的括號中的子模式所匹配的文本,以此類推

    例子 1 :

    復制代碼 代碼如下:
    <?php
    if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
    print "A match was found:". $matches[0];
    } else {
    print "A match was not found.";
    }
    ?>


    浏覽器輸出:

    復制代碼 代碼如下:
    A match was found: PHP


    在該例子中,由於使用了 i 修正符,因此會不區分大小寫去文本中匹配 php 。
    提示
    preg_match() 第一次匹配成功後就會停止匹配,如果要實現全部結果的匹配,即搜索到subject結尾處,則需使用 preg_match_all() 函數。
    例子 2 ,從一個 URL 中取得主機域名 :

    復制代碼 代碼如下:
    <?php
    // 從 URL 中取得主機名
    preg_match("/^(http://)?([^/]+)/i","http://www.jb51.net/index.html", $matches);
    $host = $matches[2];
    // 從主機名中取得後面兩段
    preg_match("/[^./]+.[^./]+$/", $host, $matches);
    echo "域名為:{$matches[0]}";
    ?>


    浏覽器輸出:

    復制代碼 代碼如下:
    域名為:jb51.net


    preg_match_all()
    preg_match_all() 函數用於進行正則表達式全局匹配,成功返回整個模式匹配的次數(可能為零),如果出錯返回 FALSE 。
    語法:
    int preg_match_all( string pattern, string subject, array matches [, int flags ] )
    參數說明:

    參數 說明 pattern 正則表達式 subject 需要匹配檢索的對象 matches 存儲匹配結果的數組 flags

    可選,指定匹配結果放入 matches 中的順序,可供選擇的標記有:

    1. PREG_PATTERN_ORDER:默認,對結果排序使 $matches[0] 為全部模式匹配的數組,$matches[1] 為第一個括號中的子模式所匹配的字符串組成的數組,以此類推
    2. PREG_SET_ORDER:對結果排序使 $matches[0] 為第一組匹配項的數組,$matches[1] 為第二組匹配項的數組,以此類推
    3. PREG_OFFSET_CAPTURE:如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量

    下面的例子演示了將文本中所有 <pre></pre> 標簽內的關鍵字(php)顯示為紅色。

    復制代碼 代碼如下:
    <?php
    $str = "<pre>學習php是一件快樂的事。</pre><pre>所有的phper需要共同努力!</pre>";
    $kw = "php";
    preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
    for($i=0;$i<count($mat[0]);$i++){
    $mat[0][$i] = $mat[1][$i];
    $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
    $str = str_replace($mat[1][$i], $mat[0][$i], $str);
    }
    echo $str;
    ?>


    正則匹配中文漢字
    正則匹配中文漢字根據頁面編碼不同而略有區別:
    •GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+
    •UTF-8編碼:[x{4e00}-x{9fa5}]+/u
    例子:

    復制代碼 代碼如下:
    <?php
    $str = "學習php是一件快樂的事。";
    preg_match_all("/[x80-xff]+/", $str, $match);
    //UTF-8 使用:
    //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
    print_r($match);
    ?>


    輸出:

    復制代碼 代碼如下:


    Array
    (
    [0] => Array
    (
    [0] => 學習
    [1] => 是一件快樂的事。
    )

    )

    1. 上一頁:
    2. 下一頁:
    Copyright © 程式師世界 All Rights Reserved