在網頁開發中,HTML 是不可或缺的元素。但是有時候我們需要從 HTML 中提取純文字而不帶有 HTML 標記。這時候,正規表示式就是一個很方便的工具。
在 PHP 中,可以使用 preg_replace() 函數來刪除 HTML 標記。此函數的用法如下:
preg_replace($pattern, $replacement, $subject);
其中,$pattern 是正規表示式模式,$replacement 是替換字串,$subject 是待處理的字串。請注意,$pattern 和 $replacement 都可以是數組,這在下文中會涉及。
接下來,我們將討論幾個常見的刪除 HTML 標籤的正規表示式。
$pattern = '/<[^>]*>/'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
在這個正規表示式中,< 表示左尖括號,#1## 表示匹配除了右尖括號以外的任何字符,* 表示匹配0 次或多次。因此,這個表達式將匹配任何 HTML 標記,並將其替換為空字元。
$pattern = '/<script[^>]*>(.*?)</script>/is'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);