php4中引入了foreach結構,這是一種遍歷數組的簡單方式。相比傳統的for循環,foreach能夠更加便捷的獲取鍵值對。在php5之 前,foreach僅能用於數組;php5之後,利用foreach還能遍歷對象(詳見:遍歷對象)。本文中僅討論遍歷數組的情況。
foreach雖然簡單,不過它可能會出現一些意外的行為,特別是代碼涉及引用的情況下。
下面列舉了幾種case,有助於我們進一步認清foreach的本質。
問題1:
復制代碼 代碼如下:
$arr = array(1,2,3);
foreach($arr as $k => &$v) {
$v = $v * 2;
}
// now $arr is array(2, 4, 6)
foreach($arr as $k => $v) {
echo "$k", " => ", "$v";
}
先從簡單的開始,如果我們嘗試運行上述代碼,就會發現最後輸出為0=>2 1=>4 2=>4 。
為何不是0=>2 1=>4 2=>6 ?
其實,我們可以認為 foreach($arr as $k => $v) 結構隱含了如下操作,分別將數組當前的'鍵'和當前的'值'賦給變量$k和$v。具體展開形如:
復制代碼 代碼如下:
foreach($arr as $k => $v){
//在用戶代碼執行之前隱含了2個賦值操作
$v = currentVal();
$k = currentKey();
//繼續運行用戶代碼
……
}
根據上述理論,現在我們重新來分析下第一個foreach:
第1遍循環,由於$v是一個引用,因此$v = &$arr[0],$v=$v*2相當於$arr[0]*2,因此$arr變成2,2,3
第2遍循環,$v = &$arr[1],$arr變成2,4,3
第3遍循環,$v = &$arr[2],$arr變成2,4,6
隨後代碼進入了第二個foreach:
第1遍循環,隱含操作$v=$arr[0]被觸發,由於此時$v仍然是$arr[2]的引用,即相當於$arr[2]=$arr[0],$arr變成2,4,2
第2遍循環,$v=$arr[1],即$arr[2]=$arr[1],$arr變成2,4,4
第3遍循環,$v=$arr[2],即$arr[2]=$arr[2],$arr變成2,4,4
OK,分析完畢。
如何解決類似問題呢?php手冊上有一段提醒:
Warning : 數組最後一個元素的 $value 引用在 foreach 循環之後仍會保留。建議使用unset()來將其銷毀。
復制代碼 代碼如下:
$arr = array(1,2,3);
foreach($arr as $k => &$v) {
$v = $v * 2;
}
unset($v);
foreach($arr as $k => $v) {
echo "$k", " => ", "$v";
}
// 輸出 0=>2 1=>4 2=>6
從這個問題中我們可以看出,引用很有可能會伴隨副作用。如果不希望無意識的修改導致數組內容變更,最好及時unset掉這些引用。
問題2:
復制代碼 代碼如下:
$arr = array('a','b','c');
foreach($arr as $k => $v) {
echo key($arr), "=>", current($arr);
}
// 打印 1=>b 1=>b 1=>b
這個問題更加詭異。按照手冊的說法,key和current分別是取數組中當前元素的的鍵值。
那為何key($arr)一直是1,current($arr)一直是b呢?
先用vld查看編譯之後的opcode:
我們從第3行的ASSIGN指令看起,它代表將array('a','b','c')賦值給$arr。
由 於$arr為CV,array('a','b','c')為TMP,因此ASSIGN指令找到實際執行的函數為 ZEND_ASSIGN_SPEC_CV_TMP_HANDLER。這裡需要特別指出,CV是PHP5.1之後才增加的一種變量cache,它采用數組的 形式來保存zval**,被cache住的變量再次使用時無需去查找active符號表,而是直接去CV數組中獲取,由於數組訪問速度遠超hash表,因 而可以提高效率。
復制代碼 代碼如下:
static int ZEND_FASTCALL ZEND_ASSIGN_SPEC_CV_TMP_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
zend_op *opline = EX(opline);
zend_free_op free_op2;
zval *value = _get_zval_ptr_tmp(&opline->op2, EX(Ts), &free_op2 TSRMLS_CC);
// CV數組中創建出$arr**指針
zval **variable_ptr_ptr = _get_zval_ptr_ptr_cv(&opline->op1, EX(Ts), BP_VAR_W TSRMLS_CC);
if (IS_CV == IS_VAR && !variable_ptr_ptr) {
……
}
else {
// 將array賦值給$arr
value = zend_assign_to_variable(variable_ptr_ptr, value, 1 TSRMLS_CC);
if (!RETURN_VALUE_UNUSED(&opline->result)) {
AI_SET_PTR(EX_T(opline->result.u.var).var, value);
PZVAL_LOCK(value);
}
}
ZEND_VM_NEXT_OPCODE();
}
ASSIGN指令完成之後,CV數組中被加入zval**指針,指針指向實際的array,這表示$arr已經被CV緩存了起來。
接下來執行數組的循環操作,我們來看FE_RESET指令,它對應的執行函數為ZEND_FE_RESET_SPEC_CV_HANDLER:
復制代碼 代碼如下:
static int ZEND_FASTCALL ZEND_FE_RESET_SPEC_CV_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
……
if (……) {
……
} else {
// 通過CV數組獲取指向array的指針
array_ptr = _get_zval_ptr_cv(&opline->op1, EX(Ts), BP_VAR_R TSRMLS_CC);
……
}
……
// 將指向array的指針保存到zend_execute_data->Ts中(Ts用於存放代碼執行期的temp_variable)
AI_SET_PTR(EX_T(opline->result.u.var).var, array_ptr);
PZVAL_LOCK(array_ptr);
if (iter) {
……
} else if ((fe_ht = HASH_OF(array_ptr)) != NULL) {
// 重置數組內部指針
zend_hash_internal_pointer_reset(fe_ht);
if (ce) {
……
}
is_empty = zend_hash_has_more_elements(fe_ht) != SUCCESS;
// 設置EX_T(opline->result.u.var).fe.fe_pos用於保存數組內部指針
zend_hash_get_pointer(fe_ht, &EX_T(opline->result.u.var).fe.fe_pos);
} else {
……
}
……
}
這裡主要將2個重要的指針存入了zend_execute_data->Ts中:
•EX_T(opline->result.u.var).var ---- 指向array的指針
•EX_T(opline->result.u.var).fe.fe_pos ---- 指向array內部元素的指針
FE_RESET指令執行完畢之後,內存中實際情況如下:
接下來我們繼續查看FE_FETCH,它對應的執行函數為ZEND_FE_FETCH_SPEC_VAR_HANDLER:
復制代碼 代碼如下:
static int ZEND_FASTCALL ZEND_FE_FETCH_SPEC_VAR_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
zend_op *opline = EX(opline);
// 注意指針是從EX_T(opline->op1.u.var).var.ptr獲取的
zval *array = EX_T(opline->op1.u.var).var.ptr;
……
switch (zend_iterator_unwrap(array, &iter TSRMLS_CC)) {
default:
case ZEND_ITER_INVALID:
……
case ZEND_ITER_PLAIN_OBJECT: {
……
}
case ZEND_ITER_PLAIN_ARRAY:
fe_ht = HASH_OF(array);
// 特別注意:
// FE_RESET指令中將數組內部元素的指針保存在EX_T(opline->op1.u.var).fe.fe_pos
// 此處獲取該指針
zend_hash_set_pointer(fe_ht, &EX_T(opline->op1.u.var).fe.fe_pos);
// 獲取元素的值
if (zend_hash_get_current_data(fe_ht, (void **) &value)==FAILURE) {
ZEND_VM_JMP(EX(op_array)->opcodes+opline->op2.u.opline_num);
}
if (use_key) {
key_type = zend_hash_get_current_key_ex(fe_ht, &str_key, &str_key_len, &int_key, 1, NULL);
}
// 數組內部指針移動到下一個元素
zend_hash_move_forward(fe_ht);
// 移動之後的指針保存到EX_T(opline->op1.u.var).fe.fe_pos
zend_hash_get_pointer(fe_ht, &EX_T(opline->op1.u.var).fe.fe_pos);
break;
case ZEND_ITER_OBJECT:
……
}
……
}
根據FE_FETCH的實現,我們大致上明白了foreach($arr as $k => $v)所做的事情。它會根據ze