PHP 中的字元去重音
在 PHP 中,可以使用多種方法從其重音對應部分中提取基本字元。一種方法涉及利用 Normalizer 類,它提供本機字元規範化功能。不幸的是,Normalizer 類別可能在較舊的 PHP 版本或某些託管平台上不可用。
另一種方法涉及使用正規表示式和字元替換。以下函數(稱為 Unaccent)可有效地從字串中刪除常見的重音符號:
<code class="php">function Unaccent($string) { return preg_replace('~&([a-z]{1,2})(acute|cedil|circ|grave|lig|orn|ring|slash|th|tilde|uml);~i', '', htmlentities($string, ENT_QUOTES, 'UTF-8')); }</code>
此函數首先使用 htmlentities 將重音字元轉換為其 HTML 實體。然後,它應用一個正規表示式來識別和捕獲重音字符,包括重音標記。替換模式中的 $1 佔位符確保僅保留基本字元。
例如,在「ã」和「é」上使用此函數將分別產生「a」和「e」。
以上是如何刪除 PHP 中字元的重音符號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!