首頁 > 後端開發 > php教程 > php從字串中提取漢字字母和數字

php從字串中提取漢字字母和數字

WBOY
發布: 2023-03-02 10:48:02
原創
3047 人瀏覽過

php從字串中提取漢字字母和數字

我透過微信介面讀取使用者的暱稱,但好多名字都是一些特殊字符,如上圖,這些特殊字符存不進mysql資料庫也沒有意義。所以我想過濾一下,名字字元中只把漢字字母與數字提取出來。這個用PHP怎麼寫。

回覆內容:

php從字串中提取漢字字母和數字

我透過微信介面讀取使用者的暱稱,但好多名字都是一些特殊字符,如上圖,這些特殊字符存不進mysql資料庫也沒有意義。所以我想過濾一下,名字字元中只把漢字字母與數字提取出來。這個用PHP怎麼寫。

這些特殊字元存不進mysql資料庫也沒什麼意義
----有意義的,圖示啊,欄位類型用 varbinary 試試

其實是emoji表情符號存不進mysql
這種表情不處理直接儲存到mysql5.5以下的版本會報錯
可以修改資料庫字元集為utf8mb4試試
github上有emoji unicode提取的範圍,參照範圍在過濾的時候進行配對即可

首先,這些東西如果對你沒有什麼意義,不存就好了。

你提取出部分,也沒什麼用。

完整的訪問,mysql是支援的,轉換下字符集就好了,utf8mb4是utf8的超集,向下兼容的,修改這個是最完美的解決方法。

其次就是程式碼層面的轉碼,編碼一下,再存,取出來反編碼再展示,也可以。

最後就是這個方法,其實你只是存不進emoji而已。過濾掉emoji就OK。

<code>public static function emoji($text) {
        $clean_text = "";

        // Match Emoticons
        $regexEmoticons = '/[\x{1F600}-\x{1F64F}]/u';
        $clean_text = preg_replace($regexEmoticons, '', $text);

        // Match Miscellaneous Symbols and Pictographs
        $regexSymbols = '/[\x{1F300}-\x{1F5FF}]/u';
        $clean_text = preg_replace($regexSymbols, '', $clean_text);

        // Match Transport And Map Symbols
        $regexTransport = '/[\x{1F680}-\x{1F6FF}]/u';
        $clean_text = preg_replace($regexTransport, '', $clean_text);

        // Match Miscellaneous Symbols
        $regexMisc = '/[\x{2600}-\x{26FF}]/u';
        $clean_text = preg_replace($regexMisc, '', $clean_text);

        // Match Dingbats
        $regexDingbats = '/[\x{2700}-\x{27BF}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        $regexDingbats = '/[\x{231a}-\x{23ab}\x{23e9}-\x{23ec}\x{23f0}-\x{23f3}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        return $clean_text;
    }</code>
登入後複製

來源在這裡

相關標籤:
php
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板