> 백엔드 개발 > PHP8 > PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)

藏色散人
풀어 주다: 2023-02-17 11:58:01
앞으로
2561명이 탐색했습니다.

이 기사에서는 "PHP8 기반 커널 소스 코드 분석 - 배열 (2)"를 소개합니다. 도움이 필요한 친구들이 모두 참고할 수 있기를 바랍니다.

추천 관련 기사: "PHP8 기본 커널 소스 코드 분석 - 배열(1)" "PHP8 기본 커널 소스 코드 분석 - 배열(3)" "PHP8 기본 커널 소스 코드 분석 - 배열( 4)"

zend_array는 PHP

1.packed array
2.hash array

在上文中 补齐了zend_array的 所有值的 注释
로그인 후 복사

사실 소스코드의 순서가 위와 조금 다릅니다. 제 생각엔 위의 것 같아요 순서가 이해하기 더 합리적입니다

//源码里的代码
typedef struct _zend_array HashTable;
struct _zend_array {
zend_refcounted_h gc;
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar    flags,
zend_uchar    _unused,
zend_uchar    nIteratorsCount,
zend_uchar    _unused2)
} v;
uint32_t flags;
} u;
uint32_t          nTableMask;
Bucket           *arData;
uint32_t          nNumUsed;
uint32_t          nNumOfElements;
uint32_t          nTableSize;
uint32_t          nInternalPointer;
zend_long         nNextFreeElement;
dtor_func_t       pDestructor;
};
//我调换下顺序后的代码
struct _zend_array {
zend_refcounted_h gc; 
 ///  gc  占用8个字节 用于引用计数和  字符串类型的记录
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar    flags,
// flags   8位的无符号字符, 最大值为255   标记HashTable用 PHP8 中有6个值
zend_uchar    _unused,
zend_uchar    nIteratorsCount,
//迭代器计数。foreach语句会在全局变量EG中创建一个迭代器,
//迭代器包含正在遍历的HashTable和游标信息。
//nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。
zend_uchar    _unused2)
} v;
  //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistency
uint32_t flags;
             //
} u;
// u是是一个联合体。占用4个字节。
//可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v,
//这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。
Bucket           *arData;
//HashTable中存储数据的单元的指针。
//  用来存储key和value以及辅助信息的容器。
uint32_t          nTableSize;
//    HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。
//该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。
uint32_t          nNumUsed;
//指所有已使用bucket的数量,包括有效bucket和无效bucket的数量
uint32_t          nNumOfElements;
//有效bucket的数量。该值总是小于或等于nNumUsed
uint32_t          nTableMask;
//索引大小。一般值为  -nTableSize。
uint32_t          nInternalPointer;
//全局默认游标。reset/key/current/next/prev等宏 和操作都会用到
zend_long         nNextFreeElement;
//下一个插入的元素的key的下标  
//比如  当$a[] = 1  nNextFreeElement =1  
dtor_func_t       pDestructor;
//指向一个函数   typedef void (*dtor_func_t)(zval *pDest);
//可以看出是pDest是zval结构指针二级指针,
//为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入
//当bucket元素被更新或者被删除时,会对bucket的value调用该函数,
//如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。
};
로그인 후 복사

사용 이해 도구에서 생성된 멤버 변수 다이어그램은 다음과 같습니다

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)

모두 확장하면 다음과 같습니다

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)

zend_array 구조체 멤버

를 보면 알 수 있습니다 코어는 실제로 z_val +zend_string +zend_refcounted_h+Bucket으로 레이어별로 연결되어 있습니다

Bucket이 저장되는 곳 배열의 핵심 정보

typedef struct _Bucket {
zval              val;   //数组的值 ( 复习下 zval只有16个字节)
zend_ulong         h;     // key的 h  值
zend_string      *key;      //当数组为 hash_array时候 会用到 也就是 key的值  
} Bucket;
로그인 후 복사

배열 유형이 Packed_array 또는 hash_array인지에 관계없이 결국 버킷에 저장됩니다

키가 모두 숫자 키이고 삽입 순서에 따라 키가 증가하면 배열 유형은 packed_array입니다.

패키징 배열의 특징

  1. 배열을 인덱싱할 필요가 없습니다.
  2. 키가 필요하지 않습니다
  3. 키가 없는 배열의 h 값은 0
  4. key에서 시작하는 버킷 공간의 정렬 값과 직접 같습니다. -value 배열의 h 값 쌍은 키의 내용과 같습니다

세 번째와 네 번째 항목은 PHP에서 배열로 이해될 수 있습니다. 키를 작성하지 않으면 기본 키는 0

$a =array(1,2,3);  // packed array
$b =array(1=>'a',3=>'b',5=>'c'); //packed array
로그인 후 복사
PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)

bucket 배열 앞에 인덱스 배열이 있을 겁니다

패키지 배열일 때 인덱스 배열은 사용되지 않기 때문에 크기는 항상 2입니다

zend_array의 내용 위의 $a에 해당하는

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)
$a zend_array

nTableSize는 arData가 가리키는 버킷 배열의 크기, 즉 전체 버킷의 개수를 나타냅니다. =배열의 전체 크기

nNumUsed;                                                                                                                                         유효 버킷 수와 유효하지 않은 버킷 수를 포함하여 사용된 모든 버킷 수를 참조하는 배열의 총 크기

nNumOfElements;

그래서 nNumOfElements+nNumUsed =nTableSize

nTableMask; 패킹된 배열은 인덱스를 사용하지 않기 때문에 항상 -2

nNextFreeElement입니다. 다음에 삽입되는 요소

패킹된 배열은 버킷 배열의 연속성 특성을 활용하여 숫자 키만으로 특정 시나리오를 최적화합니다. . 인덱스 배열이 더 이상 필요하지 않으므로 (nTableSize-2)* sizeof(uint32_t) 바이트가 메모리 공간에서 절약됩니다. 또한, 버킷에 직접 접근하면 버킷 어레이를 동작시키기 때문에 성능도 향상된다.

패키징된 배열의 조건이 충족되지 않으면 PHP에서는 배열이 hash_array로 표시됩니다.

숫자가 아닌 모든 키 값은 hash_array

$c =array('x'=>1,'y'=>2,'z'=>3,'a'=>0);
로그인 후 복사
로 표시됩니다.

$c 위는 hash_array로 표현됩니다.

버킷은 다음과 같습니다.

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)
$c 버킷

zend_array는 다음과 같습니다.

PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)
$c zend_array

n테이블 크기 ; arData가 가리키는 버킷 배열의 크기, 즉 전체 버킷의 개수를 나타낸다. =8

nNumUsed; 유효한 버킷 수와 유효하지 않은 버킷 수를 포함하여 사용된 모든 버킷 수를 나타냅니다. =4

NumOfElements; =4

그래서 nNumOfElements+nNumUsed =nTableSize

nTableMask; -8

nNextFreeElement; 다음에 삽입되는 요소 hash_array의 키 아래 첨자는 사용되지 않으면 항상 0이 됩니다.

▏이 기사는 원저자 PHP Cui Xuefeng의 승인을 받았으며 PHP 중국어 웹사이트에 게시되었습니다. 원래 주소는 다음과 같습니다: https://zhuanlan.com/p/358354087

위 내용은 PHP8 기본 커널 소스 코드 구문 분석 - 배열(2)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:zhihu.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿