Dans le développement web, le HTML est un élément essentiel. Mais parfois, nous devons extraire du texte brut du HTML sans balises HTML. À l’heure actuelle, les expressions régulières sont un outil très pratique.
En PHP, vous pouvez utiliser la fonction preg_replace() pour supprimer les balises HTML. L'utilisation de cette fonction est la suivante :
preg_replace($pattern, $replacement, $subject);
Où, $pattern est le modèle d'expression régulière, $replacement est la chaîne de remplacement et $subject est la chaîne à traiter. Notez que $pattern et $replacement peuvent être des tableaux, comme indiqué ci-dessous.
Ensuite, nous discuterons de plusieurs expressions régulières courantes pour supprimer les balises HTML.
$pattern = '/<[^>]*>/'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
Dans cette expression régulière, < signifie crochet angulaire gauche, 1 signifie correspondre à n'importe quel caractère sauf le crochet angulaire droit, * signifie correspondre 0 fois ou plus. Par conséquent, cette expression correspondra à n’importe quelle balise HTML et la remplacera par le caractère nul.
$pattern = '/<script[^>]*>(.*?)</script>/is'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
Cette expression régulière fera correspondre n'importe quel texte avec une balise