解析PHP8底层内核源码-数组(一)
本篇文章给大家介绍《解析PHP8底层内核源码-数组(一)》。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。
相关文章推荐:《解析PHP8底层内核源码-数组(二)》《解析PHP8底层内核源码-数组(三)》《解析PHP8底层内核源码-数组(四)》
PHP 的数组 不仅在变量中使用 (zval中array指针类型) 内核中也经常使用比如符号表 。
PHP8中 数组用_zendarray 表示 别名为 zend_array 和hashtable
之所以有两个别名是因为 为了兼容以前低版本的函数 (你现在看一些函数或者宏的代码可以看到有的用hashtable 有的用zend_array)
PHP里数组是一个“双向的有序多维链表”
有两个特点
一。存储着键-值(key-value)对
二。有序
可以理解为高级的hash表
在PHP8中 数组的定义在 zend_types.h 中 核心代码如下
typedef struct _zend_array zend_array; //别名zend_array typedef struct _zend_array HashTable; //别名 HashTable struct _zend_array { zend_refcounted_h gc; //和zend_string一样 还记得前面的zend_string 吗? /// gc 占用8个字节 用于引用计数和 字符串类型的记录 union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, // flags 8位的无符号字符, 最大值为255 标记HashTable用 PHP8 中有6个值 //#define HASH_FLAG_CONSISTENCY ((1<<0) | (1<<1)) //#define HASH_FLAG_PACKED (1<<2) //#define HASH_FLAG_UNINITIALIZED (1<<3) //#define HASH_FLAG_STATIC_KEYS (1<<4) /* long and interned strings */ //#define HASH_FLAG_HAS_EMPTY_IND (1<<5) //#define HASH_FLAG_ALLOW_COW_VIOLATION (1<<6) zend_uchar _unused, zend_uchar nIteratorsCount, //迭代器计数。foreach语句会在全局变量EG中创建一个迭代器, //迭代器包含正在遍历的HashTable和游标信息。 //nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。 zend_uchar _unused2) } v; //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistency uint32_t flags; // } u; // u是是一个联合体。占用4个字节。 //可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v, //这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。 Bucket *arData; //HashTable中存储数据的单元的指针。 // 用来存储key和value以及辅助信息的容器。 uint32_t nTableSize; // HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。 //该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。 uint32_t nNumUsed; //指所有已使用bucket的数量,包括有效bucket和无效bucket的数量 uint32_t nNumOfElements; //有效bucket的数量。该值总是小于或等于nNumUsed uint32_t nTableMask; //标记。一般值为 -nTableSize。 uint32_t nInternalPointer; //全局默认游标。reset/key/current/next/prev等宏 和操作都会用到 zend_long nNextFreeElement; //下一个插入的元素的key的下标 //比如 当$a[] = 1 nNextFreeElement =1 dtor_func_t pDestructor; //指向一个函数 typedef void (*dtor_func_t)(zval *pDest); //可以看出是pDest是zval结构指针二级指针, //为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入 //当bucket元素被更新或者被删除时,会对bucket的value调用该函数, //如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。 }; typedef struct _zend_refcounted_h { uint32_t refcount;//一个 32位纯数字的 refcount uint32_t type_info; } u; } zend_refcounted_h; //_zend_refcounted_h // 包括 一个 32位纯数字的 refcount 和一个联合体u //联合体u里面包括一个 type_infozend_refcounted_h 占用8字节,refount英文翻译成中文是引用的意思 显然 这个 zend_refcounted_h是为了引用计数和字符串类别存储用的。 typedef struct _Bucket { zval val; //数组的值 ( 复习下 zval只有16个字节) zend_ulong h; // key的 hash值 zend_string *key; //数组的key的 指针 /* string key or NULL for numerics */ } Bucket;
▏本文经原作者PHP崔雪峰同意,发布在php中文网,原文地址:https://zhuanlan.zhihu.com/p/352830733
以上就是解析PHP8底层内核源码-数组(一)的详细内容,更多请关注www.sxiaw.com其它相关文章!