最近碰到一個問題,要在一段HTML代碼的鏈接中加一個參數,比如其中由一個A標簽是這樣的:
1
<a href="http://www.example.com/aaa.php">鏈接文字</a>
我就要在 aaa.php 的後面加上一個參數使其變成 aaa.php?request=xxx ,但問題是不是所有的鏈接都是aaa.php這樣的形式,可能後面已經有了別的參數,比如 aaa.php?id=111 ,這樣加的時候就需要把鏈接變成 aaa.php?id=111&request=xxx 。
由於要處理的是一大塊HTML,所以首先想到的解決方案是正則替換,不過 preg_replace 不能做條件判斷,只能做一種替換,然後我就找到了 preg_replace_callback() 這個函數,大喜,以為找到了銀彈。這個東西的用法和 preg_replace() 函數幾乎一樣,不過它提供了一個 callback 函數,可以在替換的時候根據條件替換。在PHP手冊中提供了這麼一個例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
<?php
// 此文本是用於 2002 年的,
// 現在想使其能用於 2003 年
$text = "April fools day is 04/01/2002\n";
$text.= "Last christmas was 12/24/2001\n";
// 回調函數
function next_year($matches) {
// 通常:$matches[0] 是完整的匹配項
// $matches[1] 是第一個括號中的子模式的匹配項
// 以此類推
return $matches[1].($matches[2]+1);
}
echo preg_replace_callback(
"|(\d{2}/\d{2}/)(\d{4})|",
"next_year",
$text);
// 結果為:
// April fools day is 04/01/2003
// Last christmas was 12/24/2002
?>
看了這個例子之後我以為只要把想要替換的內容替換掉就OK了,比如我只想更改捕獲的第二個匹配項,只需要把 $matches[2]中的內容改一下返回就行了。然後我就寫了下面的代碼測試:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
$content = '<a href="http://www.example.com/aaa.php">鏈接1</a><a href="http://www.example.com/aaa.php?id=111">鏈接2</a>';
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
// 下面是 add_request 函數定義
function add_source($matches)
{
if(strpos($matches[1], '?'))
{
return $matches[1].'&request=xxx';
}
else
{
return $matches[1].'?request=xxx';
}
}
不過實驗之後卻發現把代碼替換得亂七八糟,我找了半天都沒發現哪裡出錯了。後來仔細檢查了一下才恍然大悟,我被手冊上的例子誤導了!!其實這個函數會替換匹配的整個內容,即 /href=[\'|"](.*?)[\'|"]/ (包括 href),而不只是 (.*?) 所捕獲的東西。而手冊例子中的正則是這樣的:|(\d{2}/\d{2}/)(\d{4})| ,它的所有部分都是在()內的,所以替換成 $matches[1].($matches[2]+1) 自然不會有問題,但是它卻讓我誤以為這個函數會有針對性地替換 $matches[1] 和 $matches[2]中的內容,事實上它還是替換整個正則匹配的內容,即 $matches[0]中的內容,而加上的括號只是為了我們對字符串操作方便而已!了解這一點之後,修改了代碼:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
$content = '<a href="http://www.example.com/aaa.php">鏈接1</a><a href="http://www.example.com/aaa.php?id=111">鏈接2</a>';
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
// 下面是 add_request 函數定義
function add_source($matches)
{
if(strpos($matches[1], '?'))
{
return 'href="'.$matches[1].'&request=xxx"'; //注意,這裡和下面都加上了正則裡括號外的東西:href="
}
else
{
return 'href="'.$matches[1].'?request=xxx"';
}
}
改好之後,測試正常。
一點學習筆記,記錄在此。