程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> [PHP源碼閱讀]empty和isset函數

[PHP源碼閱讀]empty和isset函數

編輯:PHP綜合

近日被問到PHP中empty和isset函數時怎麼判斷變量的,剛開始我是一臉懵逼的,因為我自己也只是一知半解,為了弄懂其真正的原理,趕緊翻開源碼研究研究。經過分析可發現兩個函數調用的都是同一個函數,因此本文將對兩個函數一起分析。

我在github有對PHP源碼更詳細的注解。感興趣的可以圍觀一下,給個star。PHP5.4源碼注解。可以通過commit記錄查看已添加的注解。

函數使用格式

empty

bool empty ( mixed $var )


判斷變量是否為空。

 

isset

bool isset ( mixed $var [ , mixed $... ] )

判斷變量是否被設置且不為NULL。

參數說明

對於empty,在PHP5.5版本以前,empty只支持變量參數,其他類型的參數會導致解析錯誤,比如函數調用的結果不能作為參數。

對於isset,如果變量被如unset的函數設為NULL,則函數會返回false。如果多個參數被傳遞到isset函數,那麼只有所有參數都被設置isset函數才會返回true。從左到右計算,一旦遇到沒被設置的變量就停止。

 

運行示例

$result = empty(0); // true
$result = empty(null); // true
$result = empty(false); // true $result = empty(array()); // true $result = empty('0'); // true $result = empty(1); // false $result = empty(callback function); // 報錯

$a = null;
$result = isset($a); // false;

$a = 1;
$result = isset($a); // true;

$a = 1;$b = 2;$c = 3;
$result = isset($a, $b, $c); // true

$a = 1;$b = null;$c = 3;
$result = isset($a, $b, $c); // false

 

找到函數的定義位置

實際上,empty不是一個函數,而是一個語言結構。語言結構是在PHP程序運行前編譯好的,因此不能像之前那樣簡單地搜索"PHP_FUNCTION empty"或"ZEND_FUNCTION empty"查看其源碼。要想看empty等語言結構的源碼,先要理解PHP代碼執行的機制。

PHP執行代碼會經過4個步驟,其流程圖如下所示:

 


在第一個階段,即Scanning階段,程序會掃描zend_language_scanner.l文件將代碼文件轉換成語言片段。對於isset和empty函數來說,在zend_language_scanner.l文件中搜索empty和isset可以得到函數在此文件中的宏定義如下:

<ST_IN_SCRIPTING>"isset" {
return T_ISSET;
}


<ST_IN_SCRIPTING>"empty" {
return T_EMPTY;
}


接下來就到了Parsing階段,這個階段,程序將T_ISSET和T_EMPTY等Tokens轉換成有意義的表達式,此時會做語法分析,Tokens的yacc保存在zend_language_parser.y文件中,可以找到T_ISSET和T_EMPTY的定義:

internal_functions_in_yacc:
T_ISSET '(' isset_variables ')' { $$ = $3; }
| T_EMPTY '(' variable ')' { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }
| T_INCLUDE expr { zend_do_include_or_eval(ZEND_INCLUDE, &$$, &$2 TSRMLS_CC); }
| T_INCLUDE_ONCE expr { zend_do_include_or_eval(ZEND_INCLUDE_ONCE, &$$, &$2 TSRMLS_CC); }
| T_EVAL '(' expr ')' { zend_do_include_or_eval(ZEND_EVAL, &$$, &$3 TSRMLS_CC); }
| T_REQUIRE expr { zend_do_include_or_eval(ZEND_REQUIRE, &$$, &$2 TSRMLS_CC); }
| T_REQUIRE_ONCE expr { zend_do_include_or_eval(ZEND_REQUIRE_ONCE, &$$, &$2 TSRMLS_CC); }
;


isset和empty函數最終都執行了zend_do_isset_or_isempty函數,繼續查找
grep -rn "zend_do_isset_or_isempty"
可以發現,此函數在zend_compile.c文件中定義。

 

函數執行步驟

1、解析參數

2、檢查是否為可寫變量

3、如果是變量的op_type是IS_CV(編譯時期的變量),則設置其opcode為ZEND_ISSET_ISEMPTY_VAR;否則從active_op_array中獲取下一個op值,根據其op值設置last_op的opcode。

4、設置了opcode之後,之後會交給zend_excute執行。


源碼解讀

IS_CV是編譯器使用的一種cache機制,這種變量保存著它被引用的變量的地址,當一個變量第一次被引用的時候,就會被CV起來,以後這個變量的引用就不需要再去查找active符號表了。

對於empty函數,到了opcode的步驟後,參閱opcode處理函數,可以知道,isset和empty在excute的時候執行的是ZEND_ISSET_ISEMPTY_VAR等一系列函數,以ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER為例,找到這個函數的定義在zend_vm_execute.h。查看函數可以知道,empty函數的最終執行函數是i_zend_is_true(),而i_zend_is_true函數定義在zend_execute.h。i_zend_is_true函數的核心代碼如下:

        switch (Z_TYPE_P(op)) {
        case IS_NULL:
            result = 0;
            break;
        case IS_LONG:
        case IS_BOOL:
        case IS_RESOURCE:
            // empty參數為整數時非0的話就為false
            result = (Z_LVAL_P(op)?1:0);
            break;
        case IS_DOUBLE:
            result = (Z_DVAL_P(op) ? 1 : 0);
            break;
        case IS_STRING:
            if (Z_STRLEN_P(op) == 0
                || (Z_STRLEN_P(op)==1 && Z_STRVAL_P(op)[0]=='0')) {
                // empty("0") == true
                result = 0;
            } else {
                result = 1;
            }
            break;
        case IS_ARRAY:
            // empty(array) 是根據數組的數量來判斷
            result = (zend_hash_num_elements(Z_ARRVAL_P(op))?1:0);
            break;
        case IS_OBJECT:
            if(IS_ZEND_STD_OBJECT(*op)) {
                TSRMLS_FETCH();

                if (Z_OBJ_HT_P(op)->cast_object) {
                    zval tmp;
                    if (Z_OBJ_HT_P(op)->cast_object(op, &tmp, IS_BOOL TSRMLS_CC) == SUCCESS) {
                        result = Z_LVAL(tmp);
                        break;
                    }
                } else if (Z_OBJ_HT_P(op)->get) {
                    zval *tmp = Z_OBJ_HT_P(op)->get(op TSRMLS_CC);
                    if(Z_TYPE_P(tmp) != IS_OBJECT) {
                        /* for safety - avoid loop */
                        convert_to_boolean(tmp);
                        result = Z_LVAL_P(tmp);
                        zval_ptr_dtor(&tmp);
                        break;
                    }
                }
            }
            result = 1;
            break;
        default:
            result = 0;
            break;
    }


這段代碼比較直觀,函數沒有對檢測值做任何的轉換,通過這段代碼來進一步分析示例中的empty函數做分析:
empty(null),到IS_NULL分支,result=0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。

empty(false),到IS_BOOL分支,result = ZLVAL_P(false) = 0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。

empty(array()),到IS_ARRAY分支,result = zend_hash_num_elements(Z_ARRVAL_P(op)) ? 1 : 0),zend_hash_num_elements返回數組元素的數量,array為空,因此result為0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。

empty('0'),到IS_STRING分支,因為Z_STRLENP(op) == 1 且 Z_STRVAL_P(op)[0] == '0',因此result為0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。

empty(1),到IS_LONG分支,result = Z_LVAL_P(op) = 1,i_zend_is_true == 1,!i_zend_is_true() == 0,因此返回false。

 

對於isset函數,最終實現判斷的代碼是:

if (isset && Z_TYPE_PP(value) != IS_NULL) {
    ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
} else {
    ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
}

只要value被設置了且不為NULL,isset函數就返回true。

 

小結

這次閱讀這兩個函數的源碼,學習到了:

1、PHP代碼在編譯期間的執行步驟

2、如何查找PHP語言結構的源碼位置

3、如何查找opcode處理函數的具體函數

學無止境,每個人都有自己的短板,只有通過不斷學習才能將自己的短板補上。

 

原創文章,文筆有限,才疏學淺,文中若有不正之處,萬望告知。

如果本文對你有幫助,請點下推薦吧,謝謝^_^

 

最後再安利一下,我在github有對PHP源碼更詳細的注解。感興趣的可以圍觀一下,給個star。PHP5.4源碼注解。可以通過commit記錄查看已添加的注解。


參考文章
opcode處理函數查找
PHPopcode深入理解及PHP代碼執行步驟

 

更多源碼文章,歡迎訪問個人主頁繼續查看:hovertree

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved