從字串中剝離HTML 特殊字元
建立RSS 來源時,刪除HTML 標籤和特殊字元以確保相容性至關重要。雖然 strip_tags() 有效地刪除了標籤,但它通常會留下 HTML 特殊字元。
要解決此問題,有兩種可能的解決方案:
html_entity_decode():
此函數解碼HTML 實體並將其替換為相應的字元。例如, 將被轉換為空格。
preg_replace():
使用正規表示式,preg_replace() 可讓您移除特定的字元序列。以下模式匹配並刪除 HTML 特殊字元:
/&#?[a-z0-9]+;/i
此模式搜尋以 開頭,後面跟著字母和數字的組合,並以分號結尾的序列。
要實現此解決方案:
$content = preg_replace("/&#?[a-z0-9]+;/i", "", $content);
Jacco 的替代方案:
Jacco 在評論部分中建議的另一個選項是使用以下模式:
/&#?[a-z0-9]{2,8};/i
此模式將替換限制為一定字元範圍內的序列,降低了意外替換未編碼的&的風險。句子中的字元。
以上是如何有效地從字串中刪除 HTML 特殊字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!