PHP의 기본 운영 메커니즘과 작동 원리에 대한 간략한 분석

WBOY
풀어 주다: 2016-07-25 08:46:25
원래의
957명이 탐색했습니다.


 PHP는 웹 개발에 적합한 동적 언어입니다. 좀 더 구체적으로 말하자면, C 언어를 사용하여 수많은 구성 요소를 구현하는 소프트웨어 프레임워크입니다. 좀 더 좁은 의미에서는 강력한 UI 프레임워크로 간주할 수 있습니다.

PHP의 기본 구현을 이해하는 목적은 무엇입니까? 동적 언어를 잘 사용하려면 먼저 메모리 관리 및 프레임워크 모델을 이해해야 합니다. 확장된 개발을 통해 더욱 강력한 기능을 제공하여 프로그램 성능을 최적화합니다.

 1. PHP 디자인 개념 및 특징

다중 프로세스 모델: PHP는 다중 프로세스 모델이므로 , 서로 다른 요청이 서로 간섭하지 않으므로 하나의 요청이 실패해도 전체 서비스에 영향을 미치지 않습니다. 물론 시대의 발전에 따라 PHP는 이미 멀티 스레딩 모델을 지원했습니다.

약한 유형의 언어: C/C, Java, C# 및 기타 언어와 달리 PHP는 약한 유형의 언어입니다. 변수의 유형은 처음에 결정되지 않으며, 암시적 또는 명시적 유형 변환이 발생할 수 있습니다. 이 메커니즘의 유연성은 나중에 PHP에서 논의됩니다. 에 자세히 나와 있습니다.

엔진(Zend) 컴포넌트(ext) 모드는 내부 커플링을 줄여줍니다.

중간 계층(sapi)은 웹 서버와 PHP를 분리합니다.

구문은 너무 많은 사양 없이 간단하고 유연합니다. 단점은 혼합된 스타일로 이어지지만, 아무리 나쁜 프로그래머라도 그는 너무 터무니없고 전체 상황을 위험에 빠뜨리는 프로그램을 작성하지 않을 것입니다.

2. PHP의 4계층 시스템

PHP의 핵심 아키텍처는 다음과 같습니다.

그림에서 볼 수 있듯이 PHP는 아래에서 위로 4계층 시스템입니다.

Zend 엔진: Zend는 전적으로 순수 C로 구현되며 PHP의 핵심 부분입니다. PHP 코드(어휘, 구문 분석 및 기타 컴파일 프로세스)를 실행 가능한 opcode 처리로 변환하고 해당 처리 방법을 구현하며 기본 데이터를 구현합니다. 구조(예: 해시테이블, oo), 메모리 할당 및 관리, 외부 호출에 해당하는 API 메서드 제공이 모든 것의 핵심입니다. 모든 주변 기능은 Zend를 중심으로 구현됩니다.

확장: Zend 엔진을 중심으로 확장은 구성 요소를 통해 다양한 기본 서비스를 제공합니다(어레이 시리즈 등), 표준 라이브러리 등은 모두 확장을 통해 전달됩니다. , 사용자는 기능 확장, 성능 ​​최적화 및 기타 목적을 달성하기 위해 필요에 따라 자체 확장을 구현할 수도 있습니다(예를 들어 현재 Tieba에서 사용하는 PHP 중간 계층 및 서식 있는 텍스트 구문 분석은 확장의 일반적인 응용 프로그램입니다).

Sapi: Sapi의 전체 이름은 서버 애플리케이션 프로그래밍 인터페이스이며, Sapi는 일련의 후크 기능을 사용하여 PHP가 주변 데이터와 상호 작용할 수 있도록 합니다. 성공적인 디자인으로 인해 PHP 자체는 sapi를 통해 상위 계층 응용 프로그램과 성공적으로 분리 및 격리되었습니다. PHP는 더 이상 다른 응용 프로그램과 호환되는 방법을 고려할 수 없으며 응용 프로그램 자체도 다른 처리 방법을 구현할 수 있습니다. 자신의 특성에 따라.

상위 계층 애플리케이션: 우리가 일반적으로 작성하는 PHP 프로그램입니다. 웹 서버를 통해 웹 애플리케이션을 구현하고 스크립트에서 실행을 사용하는 등 다양한 sapi 방법을 통해 다양한 애플리케이션 모드를 얻을 수 있습니다. 모드 등

PHP가 자동차라면 자동차의 프레임은 PHP 그 자체이고, Zend는 자동차의 엔진이며, Ext 아래의 다양한 구성요소는 자동차의 바퀴라고 할 수 있습니다. , 자동차는 다양한 유형의 도로를 달릴 수 있으며 PHP 프로그램의 실행은 자동차가 도로를 달리는 것입니다. 따라서 우리에게는 좋은 엔진, 올바른 바퀴, 올바른 트랙이 필요합니다.

 3. Sapi

앞서 언급했듯이 Sapi는 외부 애플리케이션에서 PHP와 데이터를 교환하고 특정 처리를 구현하도록 허용합니다. 일반적인 sapi 중 일부는 다음과 같습니다.

Apache2handler: Apache를 웹 서버로 사용하고 mod_PHP 모드에서 실행할 때 이 처리 방법도 가장 널리 사용됩니다. 지금 하나.

cgi: 이것은 유명한 fastcgi 프로토콜인 PHP와 웹서버 사이의 또 다른 직접적인 상호 작용 방법이며, 최근에는 fastcgi PHP가 점점 더 많이 사용되고 있으며, 또한 비동기 웹 서버가 지원되는 유일한 방법입니다.

cli: 명령줄 호출을 위한 애플리케이션 모드

4. PHP 실행 프로세스 및 opcode

먼저 PHP 코드를 실행하는 과정을 살펴보겠습니다.

그림에서 볼 수 있듯이 PHP는 코드 조각을 얻은 후 일반적인 동적 언어 실행 프로세스를 구현합니다. , 어휘 분석, 구문 분석 및 기타 단계 후에 소스 프로그램은 명령(opcode)으로 변환되고 ZEND 가상 머신은 이러한 명령을 순서대로 실행하여 작업을 완료합니다. PHP 자체는 C로 구현되어 있으므로 최종적으로 호출되는 함수는 모두 C 함수입니다. 사실 PHP는 C로 개발된 소프트웨어라고 볼 수 있습니다.

PHP 실행의 핵심은 번역된 명령어, 즉 opcode입니다.

Opcode는 PHP 프로그램 실행의 가장 기본적인 단위입니다. Opcode는 두 개의 매개변수(op1, op2), 반환 값 및 처리 기능으로 구성됩니다. PHP 프로그램은 궁극적으로 일련의 opcode 처리 기능의 순차적 실행으로 변환됩니다.

몇 가지 일반적인 처리 기능:

1ZEND_ASSIGN_SPEC_CV_CV_HANDLER: 변수 할당($a=$b)

2ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER: 함수 호출

3ZEND_CONCAT_SPEC_CV_CV_HANDLER: 문자열 연결 $a.$b

4 ZEND_ADD_SPEC_CV_CONST_HANDLER: 추가 작업 $ a 2

 5ZEND_IS_EQUAL_SPEC_CV_CONST: 동등 판단 $a==1

 6ZEND_IS_IDENTICAL_SPEC_CV_CONST: 동등 판단 $a===1

5. HashTable — 핵심 데이터 구조

HashTable은 zend의 핵심 데이터 구조이며 거의 항상 구현에 사용됩니다. PHP의 모든 일반적인 함수에 대해 우리가 알고 있는 PHP 배열은 일반적인 응용 프로그램입니다. 또한 zend 내에서는 함수 기호 테이블, 전역 변수 등과 같은 것도 해시 테이블을 기반으로 구현됩니다.

PHP의 해시 테이블은 다음과 같은 특징을 가지고 있습니다.

일반적인 키-값 쿼리를 지원합니다.

다음과 같이 사용할 수 있습니다.

노드 추가 및 삭제는 O(1) 복잡도를 사용하는 배열

키는 혼합 유형을 지원합니다. 연관 배열과 결합된 인덱스 배열이 있습니다. 동시에

값은 혼합 유형을 지원합니다: array ("string",2332)

foreach와 같은 선형 순회 지원

Zend 해시 테이블은 일반적인 해시 테이블 해시 구조를 구현함과 동시에 이중 연결 리스트를 붙여 배열의 정방향 및 역방향 순회 기능을 제공합니다. 그 구조는 아래와 같습니다.

해시 테이블에는 키->값 형태의 해시 구조와 이중 연결 리스트 모드가 모두 있음을 알 수 있습니다. , 매우 편리하게 빠른 검색과 선형 순회를 지원합니다.

해시 구조: Zend의 해시 구조는 연결 목록을 통해 충돌을 해결하는 전형적인 해시 테이블 모델입니다. zend의 해시 테이블은 자체 성장하는 데이터 구조라는 점에 유의해야 합니다. 해시 테이블 수가 가득 차면 동적으로 2배로 확장되고 요소의 위치가 변경됩니다. 초기 크기는 8입니다. 또한, 키->값 빠른 검색을 수행할 때 zend 자체도 공간을 시간과 교환하여 프로세스 속도를 높이기 위해 일부 최적화를 수행했습니다. 예를 들어, 빠른 결정을 위해 키 길이를 식별하기 위해 각 요소에서 nKeyLength 변수가 사용됩니다.

이중 연결 목록: Zend 해시 테이블은 연결 목록 구조를 통해 요소의 선형 순회를 구현합니다. 이론적으로는 순회를 위해 단방향 연결 목록을 사용하는 것으로 충분합니다. 이중 연결 목록을 사용하는 주요 목적은 순회를 빠르게 삭제하고 방지하는 것입니다. Zend 해시 테이블은 배열로 사용될 때 일반적인 연관 배열을 지원하고 순차 인덱스 번호로 사용될 수도 있으며 둘을 혼합하는 것도 허용합니다.

PHP 연관 배열: 연관 배열은 일반적인 hash_table 애플리케이션입니다. 쿼리 프로세스는 다음 단계를 거칩니다. (코드에서 알 수 있듯이 이는 일반적인 해시 쿼리 프로세스이며 검색 속도를 높이기 위해 몇 가지 빠른 판단이 추가됩니다.):

01getKeyHashValue h;

 02index = n & nTableMask;

 03Bucket *p = arBucket[index];

 04while ( p) {

 05 if ((p->h == h) && (p->nKeyLength == nKeyLength)) {

 06 RETURN p->data;

 07 }

 08 p=p-> 다음;

 09}

 10RETURN FALTURE;

PHP 인덱스 배열: 인덱스 배열은 아래 첨자를 통해 액세스되는 공통 배열입니다. 예를 들어 $arr[0]의 경우 Zend HashTable은 내부적으로 정규화되어 있으며 인덱스 유형 키에는 해시 값과 nKeyLength(0)도 할당됩니다. 내부 멤버 변수 nNextFreeElement는 현재 할당된 최대 ID이며, 푸시할 때마다 자동으로 1씩 증가합니다. PHP가 연관 데이터와 비연관 데이터의 혼합을 달성할 수 있게 하는 것은 바로 이 정규화 프로세스입니다. 푸시 작업의 특수성으로 인해 PHP 배열의 인덱스 키 순서는 아래 첨자의 크기가 아니라 푸시 순서에 따라 결정됩니다. 예를 들어, $arr[1] = 2; $arr[2] = 3; Zend HashTable은 이를 인덱스 키로 처리합니다.

6. PHP 변수

PHP는 약한 유형의 언어이며 변수 유형을 엄격하게 구분하지 않습니다. PHP는 변수를 선언할 때 유형을 지정할 필요가 없습니다. PHP는 프로그램 실행 중에 변수 유형의 암시적 변환을 수행할 수 있습니다. 다른 강력한 형식의 언어와 마찬가지로 프로그램에서 명시적인 형식 변환도 수행할 수 있습니다. PHP 변수는 단순 유형(int, string, bool), 컬렉션 유형(배열 자원 객체) 및 상수(const)로 나눌 수 있습니다. 위의 모든 변수는 내부적으로 동일한 구조 zval을 갖습니다.

Zval은 PHP 변수를 식별하고 구현하는 데 사용되는 zend의 또 다른 매우 중요한 데이터 구조입니다.

Zval은 주로 세 부분으로 구성됩니다.

유형: 변수의 유형을 지정합니다(정수). , string, array 등)

refcount&is_ref: 참조 카운팅을 구현하는 데 사용됩니다(자세한 소개는 나중에 설명)

value: 핵심 부분, 저장됨 변수의 실제 데이터

Zvalue는 변수의 실제 데이터를 저장하는 데 사용됩니다. 여러 유형을 저장해야 하기 때문에 zvalue는 공용체이므로 약한 유형 지정을 구현합니다.

PHP 변수 유형과 실제 저장 간의 대응 관계는 다음과 같습니다.

1IS_LONG ->

2IS_DOUBLE -> dvalue

3IS_ARRAY ->

4IS_STRING -> str

 5IS_RESOURCE -> lvalue

  참조 카운팅은 메모리 재활용, 문자열 연산 등에 널리 사용됩니다. PHP의 변수는 참조 카운팅의 일반적인 응용 프로그램입니다. Zval의 참조 카운팅은 멤버 변수 is_ref 및 ref_count를 통해 구현됩니다. 참조 카운팅을 통해 여러 변수가 동일한 데이터를 공유할 수 있습니다. 잦은 복사로 인한 막대한 소비를 피하세요.

할당 작업 중에 zend는 설정 해제 작업 중에 해당 변수를 동일한 zval 및 ref_count로 지정합니다. 소멸 작업은 ref_count가 0으로 감소된 경우에만 수행됩니다. 참조 할당인 경우 zend는 is_ref를 1로 수정합니다.

PHP 변수는 참조 카운팅을 통해 변수 공유 데이터를 구현합니다. 변수 값 중 하나가 변경되면 Zend가 변수가 가리키는 zval이 공유되는 것을 발견하면 어떻게 될까요? 여러 변수를 사용하면 ref_count가 1인 zval을 복사하고 원래 zval의 refcount를 감소시킵니다. 이 프로세스를 "zval 분리"라고 합니다. zend는 쓰기 작업이 발생할 때만 복사 작업을 수행하는 것을 알 수 있으므로 쓰기 중 복사(copy-on-write)라고도 합니다.

참조 변수의 경우 요구 사항은 비참조와 동일합니다. 반대로 참조로 할당된 변수는 하나의 변수를 수정하면 번들된 모든 변수가 수정됩니다.

정수와 부동 소수점 숫자는 PHP의 기본 유형 중 하나이자 단순 변수이기도 합니다. 정수 및 부동 소수점 숫자의 경우 해당 값은 zvalue에 직접 저장됩니다. 해당 유형은 각각 long과 double입니다.

정수 유형의 경우 c와 같은 강력한 유형의 언어와 달리 PHP는 int, unsigned int, long, long long 및 int를 구분하지 않는다는 것을 zvalue 구조에서 볼 수 있습니다. 다른 유형에 관한 한 정수 유형은 long 뿐입니다. 이를 통해 PHP에서 정수의 값 범위는 컴파일러 비트 수에 따라 결정되며 고정되지 않음을 알 수 있습니다.

부동 소수점 수의 경우 정수와 마찬가지로 float와 double을 구분하지 않고 double만 구분합니다.

PHP에서 정수 범위가 범위를 벗어나면 어떻게 해야 하나요? 이 경우 자동으로 double형으로 변환되므로 주의해야 합니다. 트릭은 이것으로 인해 발생합니다.

정수와 마찬가지로 문자 변수도 PHP의 기본 유형이자 단순 변수입니다. zvalue 구조를 보면 PHP의 문자열은 실제 데이터에 대한 포인터와 C의 문자열과 유사한 길이 구조로 구성되어 있음을 알 수 있습니다. 길이는 c와 달리 실제 변수로 표시되므로 해당 문자열은 이진 데이터(\0 포함)일 수 있습니다. 동시에 PHP에서 문자열 길이 strlen을 찾는 것은 O(1) 작업입니다.

문자열 작업을 추가, 수정 또는 추가할 때 PHP는 메모리를 재할당하여 새 문자열을 생성합니다. 마지막으로 보안상의 이유로 PHP는 문자열을 생성할 때 끝에 \0

을 추가합니다.

다음 4개의 변수가 있다고 가정합니다: $strA='123'; $strB = '456'; $intA=123; intB=456;

이제 다음 문자열 접합 방법을 비교하고 설명하겠습니다.

1$res = $strA.$strB 및 $res = “$strA$strB”

 2 이 경우 zend는 메모리 조각을 다시 malloc하여 그에 따라 처리하며 일반적으로 속도는

 3$strA = $strB

 4 이것이 가장 빠릅니다. zend는 반복 복사를 피하기 위해 현재 strA를 기반으로 직접 재배치합니다

 5$ res = $intA.$ intB

 6 실제 프로그래밍에서는 을 최대한 피하도록 주의해야 합니다. 🎜> 7$strA = sprintf (“%s%s”,$strA.$strB);

 8sprintf는 PHP의 언어 구조가 아니기 때문에 가장 느린 방법입니다. . 또한 형식을 식별하고 처리하는 데 많은 시간이 걸립니다. 또한 메커니즘 자체가 malloc입니다. 그러나 sprintf 방법이 가장 읽기 쉽고 실제로는 특정 상황에 따라 유연하게 선택할 수 있습니다.

PHP 배열은 Zend HashTable을 통해 자연스럽게 구현됩니다.

foreach 작업을 구현하는 방법 배열의 Foreach는 해시 테이블의 이중 연결 목록을 순회하여 완료됩니다. 인덱스 배열의 경우 foreach를 통한 순회는 foreach보다 훨씬 효율적이므로 키->값을 검색할 필요가 없습니다. count 연산은 HashTable->NumOfElements, O(1) 연산을 직접 호출합니다. '123'과 같은 문자열의 경우 zend는 이를 정수 형식으로 변환합니다. $arr['123'] 및 $arr[123]은 동일합니다.

리소스 유형 변수는 PHP에서 가장 복잡한 변수이며 복합 구조이기도 합니다.

PHP의 zval은 광범위한 데이터 유형을 나타낼 수 있지만 사용자 정의 데이터 유형을 완전히 설명하기는 어렵습니다. 이러한 복합 구조를 나타내는 효율적인 방법이 없기 때문에 기존 연산자를 사용할 방법이 없습니다. 이 문제를 해결하려면 리소스라고 하는 본질적으로 임의의 식별자(레이블)를 통해 포인터를 참조하기만 하면 됩니다.

zval에서는 리소스의 경우 lval이 리소스의 주소를 직접 가리키는 포인터로 사용됩니다. 리소스는 임의의 복합 구조일 수 있습니다. 친숙한 mysqli, fsock, memcached 등은 모두 리소스입니다.

리소스 사용 방법:

등록: 사용자 정의 데이터 유형의 경우 자원 . 먼저 이를 등록해야 하며, zend는 전역적으로 고유한 식별자를 할당합니다.

리소스 변수 얻기: 리소스의 경우 zend는 실제 데이터의 id->hash_tale을 유지합니다. 리소스의 경우 해당 ID만 zval에 기록됩니다. 가져올 때 id를 통해 hash_table에서 특정 값을 찾아서 반환합니다.

자원 파괴: 자원의 데이터 유형은 다양합니다. Zend 자체는 그것을 파괴할 방법이 없습니다. 따라서 사용자는 리소스 등록 시 파기 기능을 제공해야 합니다. 리소스를 설정 해제하면 zend는 해당 함수를 호출하여 파기를 완료합니다. 또한 전역 리소스 테이블에서도 삭제합니다.

리소스는 이를 참조하는 모든 변수가 범위를 벗어난 후에도, 요청이 종료되고 새 요청이 생성된 후에도 오랫동안 지속될 수 있습니다. 이러한 리소스는 특별히 파기하지 않는 한 SAPI의 수명 주기 내내 유지되므로 영구 리소스라고 합니다. 많은 경우 영구 리소스는 성능을 어느 정도 향상시킬 수 있습니다. 예를 들어, 일반적인 mysql_pconnect에서 영구 리소스는 pemalloc을 통해 메모리를 할당하므로 요청이 끝날 때 해제되지 않습니다. Zend의 경우 둘 자체에는 차이가 없습니다.

PHP에서는 지역 변수와 전역 변수가 어떻게 구현되나요? 요청에 대해 PHP는 언제든지 두 개의 기호 테이블(symbol_table 및 active_symbol_table)을 볼 수 있으며, 그 중 전자가 사용됩니다. 변수. 후자는 현재 활성화된 변수 기호 테이블을 가리키는 포인터입니다. 프로그램이 함수에 들어가면 zend는 기호 테이블 x를 여기에 할당하고 active_symbol_table을 a를 가리킵니다. 이러한 방식으로 전역 변수와 지역 변수의 구별이 이루어집니다.

변수 값 얻기: PHP의 기호 테이블은 hash_table을 통해 구현됩니다. 각 변수에 고유한 식별자가 할당됩니다. 변수 값을 얻으면 테이블에서 해당 zval을 찾아 식별자에 따라 반환합니다. .

함수에서 전역 변수 사용: 함수에서는 global을 명시적으로 선언하여 전역 변수를 사용할 수 있습니다. active_symbol_table에 같은 이름의 변수에 대한 참조를 생성합니다. Symbol_table에 같은 이름의 변수가 없으면 먼저 생성됩니다.

위 내용은 Lesson Master에서 제공하는 PHP의 기본 작동 메커니즘과 작동 원리에 대한 간략한 분석입니다. 🎜>PHP와 관련된 질문은 이 사이트의 "프로그래밍 언어" 섹션을 확인하세요.


원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿