JIT est une stratégie de compilateur qui exprime le code comme un état intermédiaire, le convertit en code machine dépendant de l'architecture au moment de l'exécution et l'exécute à la volée. En PHP8, Zend VM n'a pas besoin d'interpréter certains opcodes. et ces instructions seront exécutées directement en tant qu'instructions au niveau du CPU.
JIT pour PHP 8
PHP 8 Just In Time (JIT) Compilateur Le l’impact est incontestable. Mais jusqu’à présent, j’ai constaté que l’on sait très peu de choses sur ce que JIT est censé faire.
Tutoriel vidéo recommandé : "Programmation PHP du débutant à la maîtrise"
Après de nombreuses recherches et abandons, j'ai décidé de vérifier moi-même le code source PHP. En combinant certaines de mes connaissances du langage C et toutes les informations que j'ai rassemblées jusqu'à présent, j'ai rédigé cet article qui, je l'espère, vous aidera à mieux comprendre le JIT de PHP.
Pour faire simple : lorsque le JIT fonctionne comme prévu, votre code n'est pas exécuté via la Zend VM, mais directement sous la forme d'un ensemble d'instructions au niveau du CPU.
C’est toute l’idée.
Mais pour mieux le comprendre, nous devons considérer le fonctionnement interne de PHP. Pas très compliqué, mais nécessite une introduction.
Comment le code PHP est-il exécuté ?
Comme nous le savons tous, PHP est un langage interprété, mais que signifie cette phrase elle-même ?
Chaque fois que du code PHP (script en ligne de commande ou application WEB) est exécuté, il doit passer par l'interpréteur PHP. Les plus couramment utilisés sont les interpréteurs PHP-FPM et CLI.
Le travail de l'interprète est simple : recevoir du code PHP, l'interpréter et renvoyer le résultat.
Les langues généralement interprétées suivent ce processus. Certains langages peuvent supprimer quelques étapes, mais l’idée générale est la même. En PHP, le processus est le suivant :
lit le code PHP et l'interprète comme un ensemble de mots-clés appelés Tokens. Ce processus permet à l'interprète de savoir quel code a été écrit dans chaque programme. Cette étape est appelée Lexing ou Tokenizing.
Après avoir obtenu la collection Tokens, l'interpréteur PHP tentera de les analyser. Un arbre de syntaxe abstraite (AST) est généré via un processus appelé Parsing. Ici, AST est un ensemble de nœuds représentant les opérations à effectuer. Par exemple, « écho 1 + 1 » signifie en réalité « imprimer le résultat de 1 + 1 » ou plus précisément « imprimer une opération, cette opération est 1 + 1 ».
Avec AST, il est plus facile de comprendre les opérations et les priorités. La conversion d'un arbre de syntaxe abstraite en une opération pouvant être exécutée par le CPU nécessite une expression de transition (IR), que nous appelons en PHP Opcodes. Le processus de conversion des AST en Opcodes est appelé compilation.
Avec les Opcodes, voici la partie amusante : exécuter du code ! PHP dispose d'un moteur appelé Zend VM capable de recevoir une séquence d'opcodes et de les exécuter. Une fois tous les Opcodes exécutés, Zend VM termine le programme.
Voici un organigramme qui inclut l'extension Opcache :
Quels sont les effets de la compilation JIT ?
Après avoir écouté la diffusion PHP et JIT de Zeev sur PHP Internals News, j'ai compris ce que fait réellement JIT.
Si l'extension Opcache accélère l'obtention des Opcodes directement sur la VM Zend, le JIT leur permet de s'exécuter sans utiliser du tout la VM Zend.
Zend VM est un programme écrit en C qui agit comme une couche entre les Opcodes et le CPU. JIT génère du code compilé directement au moment de l'exécution, afin que PHP puisse
ignorer la VM Zend et être exécuté directement par le CPU. En théorie, les performances seront meilleures.
Cela semble étrange car une implémentation concrète doit être écrite pour chaque type de structure avant de pouvoir être compilée en code machine. Mais en fait, c'est raisonnable.
JIT de PHP utilise une bibliothèque appelée DynASM (Dynamic Assembler), qui mappe un ensemble d'instructions CPU dans un format spécifique en code assembleur pour de nombreux types de CPU différents. Par conséquent, le compilateur n'a besoin d'utiliser DynASM que pour convertir les Opcodes en code machine pour une structure spécifique.
Cependant, il y a un problème qui me préoccupe depuis longtemps.
Si le préchargement peut analyser le code PHP en Opcodes avant l'exécution et que DynASM peut compiler les Opcodes en code machine (compilation Just In Time), pourquoi n'utilisons-nous pas immédiatement la compilation Ahead of Time ?
L'une des raisons pour lesquelles j'ai découvert en écoutant la diffusion de Zeev est que PHP est un langage faiblement typé, ce qui signifie que PHP ne connaît souvent pas le type d'une variable jusqu'à ce que la VM Zend essaie d'exécuter un opcode .
Vous pouvez vérifier le type d'union Zend_value pour savoir que de nombreux pointeurs pointent vers des variables de types différents. Chaque fois que Zend VM essaie d'obtenir une valeur d'un Zend_value, elle utilise une macro comme ZSTR_VAL pour obtenir un pointeur vers une chaîne dans le type union.
Par exemple, ce gestionnaire de VM Zend gère les expressions "inférieur ou égal à" (
Utiliser du code machine pour effectuer une logique d'inférence de type n'est pas réalisable et peut devenir plus lent.
Évaluer d'abord puis compiler n'est pas non plus une bonne option car la compilation en code machine est une tâche gourmande en CPU. Donc, tout compiler au moment de l’exécution n’est pas non plus une bonne chose.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!