程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> php函數之子字符串替換 str_replace

php函數之子字符串替換 str_replace

編輯:關於PHP編程

str_replace — 子字符串替換 [str_replace]
mixed str_replace ( mixed $search , mixed $replace , mixed $subject [, int &$count ] )
php函數str_replace: 返回一個字符串或者數組。該字符串或數組是將 subject 中全部的 search 都被 replace 替換之後的結果。

現在我們所能知道的一些這個函數的用法,如:str_replace("#", "-", "dizaz#7#final"),str_replace(array('#', '$'), "-", "dizaz#7$final") 等,就這些調用方式,php內部是如何實現的呢,鑒於[深入理解PHP內核],在這裡小做分析。

測試代碼:
復制代碼 代碼如下:
<?php
$object = "dizaz#7#final";
$res = str_replace("#", "-", $object);
echo $res;


如上,先從字符“#”替換為字符“-”開始。

預備工作:

下載PHP源代碼,http://www.php.net下載即可
打造自己的閱讀代碼的工具[本人使用VIM+CSCOPE] 另:Linux用戶也推薦圖形化查看源代碼工具kscope [google之]
編譯工具[gcc],調試工具[gdb],另:GDB圖形化端口DDD也很不錯,推薦
編譯PHP源碼,記得使用--enable-debug [當然也希望通過./configure --help 看看PHP提供的一些編譯選項,會有很多收獲的]
開始分析:

通過[深入理解PHP內核]閱讀,我們不難發現其PHP提供標准函數所在目錄為PHP-SOURCE-DIR/ext/standard目錄下,由於是字符串函數,很容易我們就可以在此目錄下找到str_replace函數實現的文件 string.c,接下來就圍繞著這個文件進行分析。[當然用CScope很容易就可以鎖定,用:cs find s str_replace]

查詢得知其定義實現:
復制代碼 代碼如下:
/* {{{ proto mixed str_replace(mixed search, mixed replace, mixed subject [, int &replace_count])
Replaces all occurrences of search in haystack with replace */
PHP_FUNCTION(str_replace)
{
php_str_replace_common(INTERNAL_FUNCTION_PARAM_PASSTHRU, 1);

}
/* }}} */

現在需要查看函數php_str_replace_common函數
復制代碼 代碼如下:
/* {{{ php_str_replace_common
*/
static void php_str_replace_common(INTERNAL_FUNCTION_PARAMETERS, int case_sensitivity)
{
/**
* TODO
* typedef struct _zval_struct zval;
* typedef struct _zend_class_entry zend_class_entry
*
* struct _zval_struct {
* zvalue_value value;
* zend_uint refcount__gc;
* zend_uchar type;
* zend_uchar is_ref__gc;
* };
*
* typedef union _zvalue_value {
* long lval;
* double dval;
* struct {
* char *val;
* int len;
* } str;
* HashTable *ht;
* zend_object_value obj;
* } zvalue_value;
*
* typedef struct _zend_object {
* zend_class_entry *ce;
* HashTable *properties;
* HashTable *guards;
* } zend_object;
*
*/
zval **subject, **search, **replace, **subject_entry, **zcount = NULL;
zval *result;
char *string_key;
uint string_key_len;
ulong num_key;
int count = 0;
int argc = ZEND_NUM_ARGS();
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "ZZZ|Z", &search, &replace, &subject, &zcount) == FAILURE) {
return;
}
SEPARATE_ZVAL(search);
SEPARATE_ZVAL(replace);
SEPARATE_ZVAL(subject);
/* Make sure we're dealing with strings and do the replacement. */
if (Z_TYPE_PP(search) != IS_ARRAY) {
....//代碼省濾
} else { /* if subject is not an array */
php_str_replace_in_subject(*search, *replace, subject, return_value, case_sensitivity, (argc > 3) ? &count : NULL);
}
if (argc > 3) {
zval_dtor(*zcount);
ZVAL_LONG(*zcount, count);
}
}
/* }}} */

繼續跟蹤php_str_replace_in_subject
復制代碼 代碼如下:
/* {{{ php_str_replace_in_subject
*/
static void php_str_replace_in_subject(zval *search, zval *replace, zval **subject, zval *result, int case_sensitivity, int *replace_count)
{
zval **search_entry,
**replace_entry = NULL,
temp_result;
char *replace_value = NULL;
int replace_len = 0;
/* Make sure we're dealing with strings. */
convert_to_string_ex(subject);
Z_TYPE_P(result) = IS_STRING;
if (Z_STRLEN_PP(subject) == 0) {
ZVAL_STRINGL(result, "", 0, 1);
return;
}
/* If search is an array */
if (Z_TYPE_P(search) == IS_ARRAY) {
...//不走這步
} else {
if (Z_STRLEN_P(search) == 1) { //例子中只有”#“所以,執行這一步。
php_char_to_str_ex(Z_STRVAL_PP(subject),//subject的值,也就是dizaz#7#final
Z_STRLEN_PP(subject), //獲取subject的長度
Z_STRVAL_P(search)[0], //由於只有1個”#”,所以只需要第一個字符
Z_STRVAL_P(replace), //所要替換成的字符,現在是“-”
Z_STRLEN_P(replace), //目標字符的長度,現在為1
result, //替換結果
case_sensitivity, //大小寫是否敏感,默認是1
replace_count); //替換次數
} else if (Z_STRLEN_P(search) > 1) {
Z_STRVAL_P(result) = php_str_to_str_ex(Z_STRVAL_PP(subject), Z_STRLEN_PP(subject),
Z_STRVAL_P(search), Z_STRLEN_P(search),
Z_STRVAL_P(replace), Z_STRLEN_P(replace), &Z_STRLEN_P(result), case_sensitivity, replace_count);
} else {
MAKE_COPY_ZVAL(subject, result);
}
}
}

到現在為止,我們的目標最終鎖定到了php_char_to_str_ex 函數,現在只需要分析這個函數就OK了。其實現為:
復制代碼 代碼如下:
/* {{{ php_char_to_str_ex
*/
PHPAPI int php_char_to_str_ex(char *str, uint len, char from, char *to, int to_len, zval *result, int case_sensitivity, int *replace_count)
{
int char_count = 0;
int replaced = 0;
char *source, *target, *tmp, *source_end=str+len, *tmp_end = NULL;
if (case_sensitivity) { //現在case_sensitivity = 1
char *p = str, *e = p + len;
     //計算需要替換幾次
while ((p = memchr(p, from, (e - p)))) {
char_count++;
p++;
}
} else {
for (source = str; source < source_end; source++) {
if (tolower(*source) == tolower(from)) {
char_count++;
}
}
}
if (char_count == 0 && case_sensitivity) {
ZVAL_STRINGL(result, str, len, 1);
return 0;
}
//計算替換以後的長度,並且存儲到result中。
Z_STRLEN_P(result) = len + (char_count * (to_len - 1));
//申請內存,存放替換後的數據
Z_STRVAL_P(result) = target = safe_emalloc(char_count, to_len, len + 1);
//設定結果是一個字符串
Z_TYPE_P(result) = IS_STRING;
//target跟result的值都指向統一塊內存,所以只需要處理target
if (case_sensitivity) {
char *p = str, *e = p + len, *s = str;
while ((p = memchr(p, from, (e - p)))) { //判斷在第幾個字符出現#
memcpy(target, s, (p - s)); //把#以前的數據拷貝給target
target += p - s;
memcpy(target, to, to_len); //把目標字符拷貝給target[當然此時的target是開始target+p-s的]
target += to_len;
p++;
s = p;
if (replace_count) {
*replace_count += 1; //設定替換次數
}
}
//如果後面還有,繼續添加到target後,這樣target所指向的內存塊已經是替換好的數據了。
if (s < e) {
memcpy(target, s, (e - s));
target += e - s;
}
} else {
for (source = str; source < source_end; source++) {
if (tolower(*source) == tolower(from)) {
replaced = 1;
if (replace_count) {
*replace_count += 1;
}
for (tmp = to, tmp_end = tmp+to_len; tmp < tmp_end; tmp++) {
*target = *tmp;
target++;
}
} else {
*target = *source;
target++;
}
}
}
*target = 0;
return replaced;
}
/* }}} */

如上注釋,其就這樣完成了對於字符到字符串的替換。至於其中怎麼return,怎麼一個詳細的過程,需要再對PHP執行過程有個相對的了解。
當然可以用gdb下斷點到php_char_to_str_ex函數,來了解其詳細執行過程。
下一篇來做對於字符串替換成字符串的分析。
小結:
其結果是存在zval中
其對替換的實現比較巧妙,可以學習
需要繼續查看源碼,學習更多編寫技巧以及設計技巧。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved