In der Webentwicklung ist HTML ein wesentliches Element. Aber manchmal müssen wir einfachen Text ohne HTML-Tags aus HTML extrahieren. Derzeit sind reguläre Ausdrücke ein sehr praktisches Werkzeug.
In PHP können Sie die Funktion preg_replace() verwenden, um HTML-Tags zu entfernen. Die Verwendung dieser Funktion ist wie folgt:
preg_replace($pattern, $replacement, $subject);
Wobei $pattern das reguläre Ausdrucksmuster, $replacement die Ersetzungszeichenfolge und $subject die zu verarbeitende Zeichenfolge ist. Beachten Sie, dass sowohl $pattern als auch $replacement Arrays sein können, wie unten erläutert.
Als nächstes besprechen wir einige gängige reguläre Ausdrücke zum Entfernen von HTML-Tags.
$pattern = '/<[^>]*>/'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
In diesem regulären Ausdruck bedeutet < eine Übereinstimmung mit der linken spitzen Klammer, 1 bedeutet, dass jedes Zeichen mit Ausnahme der rechten spitzen Klammer übereinstimmt, * bedeutet, dass es keine oder mehrere Übereinstimmungen gibt. Daher stimmt dieser Ausdruck mit jedem HTML-Tag überein und ersetzt es durch das Nullzeichen.
$pattern = '/<script[^>]*>(.*?)</script>/is'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
Dieser reguläre Ausdruck gleicht jeden Text mit einem