如何有效地從字串中刪除 HTML 特殊字元？-php教程-PHP中文網

如何有效地從字串中刪除 HTML 特殊字元？

Patricia Arquette

發布： 2024-10-18 20:47:02

原創

488 人瀏覽過

How to Remove HTML Special Characters from a String Effectively?

從字串中剝離HTML 特殊字元

建立RSS 來源時，刪除HTML 標籤和特殊字元以確保相容性至關重要。雖然 strip_tags() 有效地刪除了標籤，但它通常會留下 HTML 特殊字元。

要解決此問題，有兩種可能的解決方案：

html_entity_decode():

此函數解碼HTML 實體並將其替換為相應的字元。例如，將被轉換為空格。

preg_replace():

使用正規表示式，preg_replace() 可讓您移除特定的字元序列。以下模式匹配並刪除 HTML 特殊字元：

/&amp;#?[a-z0-9]+;/i

登入後複製

此模式搜尋以開頭，後面跟著字母和數字的組合，並以分號結尾的序列。

要實現此解決方案：

$content = preg_replace("/&amp;#?[a-z0-9]+;/i", "", $content);

登入後複製

Jacco 的替代方案：

Jacco 在評論部分中建議的另一個選項是使用以下模式：

/&amp;#?[a-z0-9]{2,8};/i

登入後複製

此模式將替換限制為一定字元範圍內的序列，降低了意外替換未編碼的&的風險。句子中的字元。

以上是如何有效地從字串中刪除 HTML 特殊字元？的詳細內容。更多資訊請關注PHP中文網其他相關文章！