程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> php中字符串和正則表達式詳解

php中字符串和正則表達式詳解

編輯:PHP綜合

一、字符串類型的特點

1、PHP是弱類型語言,其他數據類型一般都可以直接應用於字符串函數操作。

<?php
echo substr("123456",2,4);  //輸出345
echo substr(123456,2,4);    //輸出345
echo hello;                 //先查找hello常量,若沒找到,將hello看做字符串使用
?>

2、字符串可以作為“數組”,是字符的集合。

<?php
$str = "www.jb51.net";
echo $str[0];
echo $str[1];
echo $str[2];
?>

但是字符串不是真的數組,不能使用數組的函數.如count($str)不會返回字符串長度。PHP引擎無法區分字符和數組,產生二義性。自PHP4起,已經用花括號替代方括號。

<?php
//為保證向後兼容,方括號仍然可以使用
$str = www.jb51.net;
echo $str{0};
echo $str{1};
echo $str{2};
?>

3、雙引號變量解析

在PHP中,當用雙引號或者定界符定義字符串時,其中的變量會被解析。

<?php
$arr = array('name' => "dwqs",'add' => "www.ido321.com");
echo "$arr[name]";  //可以解析,但是在方括號中不能使用引號
//echo "$arr['name']";  錯誤
echo "{$arr['name']}";  //可以解析,用花括號包含元素,name不帶引號也是可以的
//假設存在對象$square
echo "$square->width"; //可以解析
echo "$square->width00 cent"; //不可以解析,用花括號解決
echo "{$square->width}width00 cent"; //可以解析
?>

二、字符串輸出函數

三、常用的字符串格式函數

PS:PHP的字符串處理函數大部分不對源字符串做修改,而是返回新的字符串

四、正則表達式

正則表達式描述了一種字符串匹配的模式,通過這個模式在特定的函數中對字符串進行匹配、查找、替換和分隔等操作,由原子、元字符和模式修正符三部分組成的文字模式。

在PHP中,有兩套正則的處理函數庫:PCRE和POSIX。前者以preg_前綴命名,與Perl兼容;後者以ereg_前綴命名。二者功能相似,但PCRE的效率略高。

與Perl語言兼容的正則表達式處理函數:

1、語法

1.1 定界符:在與Perl兼容的正則函數中使用模式時,必須給模式加上定界符。除了字母、數字和反斜線(\)之外的任何字符都可以作為定界符號

<?php
//以下正則合法
echo $m1 = '/<\/\w+/';
echo $m2 = '|(\d{3})-\d|Sm';
echo $m3 = '!^(?i)php[34]!';
echo $m4 = '{^\s+(\s+)?$}';
?>

1.2 原子:原子包含了普通字符,如字母、數字;非打印字符,如空格、回車;特殊字符和元字符,如引號、*、+等,必須用”\”進行轉義;自定義原子表,如[apj]、[a-z];通用字符類型,如\d、\D。

<?php
//下面二者等價,匹配e-mail
$mail1 = '/^[0-9a-zA-Z]+@[0-9a-zA-Z]+(\.[0-9a-zA-Z]+){0,3}$/';
$mail2 = '/^\w+@\w+(\.\w+){0,3}$/';
?>

1.3 元字符:用於構建正則表達式的具有特殊含義的字符。Perl可以使用各種元字符來搜索匹配,如*、+、?.常見的元字符如下

1.4 模式修正符:在正則的定界符之外使用,擴展正則在匹配、替換等方面的功能。

2.與Perl兼容的正則表達式函數

2.1 preg_match(string pattern,string subject[,array matches]):用於對字符串的查找和匹配。參數說明:

pattern是正則,subject是需要處理的字符串,可選的matches用於保存於pattern的各個子模式的匹配結果,matches[0]保存了與pattern匹配的整體內容,matches[1]保存了pattern中第一個小括號中匹配的內容,以此類推。

<?php
header("content-type:text/html;charset=utf8");
$pattern = '/(http):\/\/(www)\.([^\.\/]+)\.(com|net|org)/i';
$subject = "我的博客:http://www.ido321.com";
if(preg_match($pattern, $subject,$matches)){
echo "搜索的URL是:".$matches[0]."<br/>";  //數組第1個元素保存整個匹配結果
echo "URL中的協議是:".$matches[1]."<br/>";//數組第2個元素保存第1個字表達式
echo "URL中的主機是:".$matches[2]."<br/>";//數組第3個元素保存第2個字表達式
echo "URL中的域名是:".$matches[3]."<br/>";//數組第4個元素保存第3個字表達式
echo "URL中的頂域是:".$matches[4]."<br/>";//數組第5個元素保存第4個字表達式
}
?>

結果

preg_match_all()與preg_match()函數類似,不同的是前者會一直匹配到字符串末尾,後者在第一次匹配後就停止匹配。

2.2 preg_grep(string pattern,array iput):匹配數組中的元素,返回與正則匹配的數組單元。參數說明:

pattern是正則,input是需要匹配的數組。

<?php
$arr = array('Linux RedHat9.0','Apache2.2.9','MySQL5.0.51','PHP5.2.6','LAMP','100');
$version = preg_grep('/^[a-zA-Z]+(\d|\.)+$/',$arr);
//輸出:Array([1]=>Apache2.2.9 [2]=>MySQL5.0.51 [3]=>PHP5.2.6)
print_r($version);
?>

2.3 preg_replace(mixed pattern,mixed replacement,mixed subject[,int limit]):字符串替換。說明:

該函數會在subject中搜索與pattern的匹配項,並用replacement替換。limit用於限制匹配的次數,即替換的次數。

<?php
$pattern = '/<[\/\!]*?[^<>]*?/is';
$text = '這個文本有<b>粗體</b>和<u>帶有下劃線</u>以及<i>斜體</i>';
echo preg_replace($pattern,"",$text);  //將所有HTML標記替換為空
echo preg_replace($pattern,"",$text,2); //值替換前2個HTML標記
?>

2.4 preg_split(string pattern,string subject[,int limit[,int flags]]):對字符串進行分割。說明:

函數返回一個數組。數組元素包含subject中與pattern匹配作為邊界所分割的字符串,limit含義見2.3,flags含義請參考文檔。

<?php
//按任數量的空格分割字符串
$kerwords = preg_split("/[\s,]+/","hypertext language,programming");
//輸出:Array([0]=>hypertext [1]=>language,[2[=>programming)
print_r($kerwords);
?>
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved