首页 >后端开发 >php教程 > 正文

php从字符串中提取汉字字母和数字

原创2016-12-01 01:27:2601816

我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。

回复内容:

我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。

这些特殊字符存不进mysql数据库也没什么意义
----有意义的,图标啊,字段类型用 varbinary 试试

其实是emoji表情符号存不进mysql
这种表情不处理直接存储到mysql5.5以下的版本会报错
可以修改数据库字符集为utf8mb4试试
github上有emoji unicode提取的范围,参照范围在过滤的时候进行匹配即可

首先,这些东西如果对你没有什么意义,不存就好了。

你提取出部分,也没什么用。

完整的存取,mysql是支持的,转换下字符集就好了,utf8mb4是utf8的超集,向下兼容的,修改这个是最完美的解决方法。

其次就是代码层面的转码,编码一下,再存,取出来反编码再展示,也可以。

最后就是这个方法,其实你只是存不进emoji而已。过滤掉emoji就OK。

public static function emoji($text) {
        $clean_text = "";

        // Match Emoticons
        $regexEmoticons = '/[\x{1F600}-\x{1F64F}]/u';
        $clean_text = preg_replace($regexEmoticons, '', $text);

        // Match Miscellaneous Symbols and Pictographs
        $regexSymbols = '/[\x{1F300}-\x{1F5FF}]/u';
        $clean_text = preg_replace($regexSymbols, '', $clean_text);

        // Match Transport And Map Symbols
        $regexTransport = '/[\x{1F680}-\x{1F6FF}]/u';
        $clean_text = preg_replace($regexTransport, '', $clean_text);

        // Match Miscellaneous Symbols
        $regexMisc = '/[\x{2600}-\x{26FF}]/u';
        $clean_text = preg_replace($regexMisc, '', $clean_text);

        // Match Dingbats
        $regexDingbats = '/[\x{2700}-\x{27BF}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        $regexDingbats = '/[\x{231a}-\x{23ab}\x{23e9}-\x{23ec}\x{23f0}-\x{23f3}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        return $clean_text;
    }

来源在这里

php中文网最新课程二维码

声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理

  • 相关标签:php
  • 相关文章

    相关视频


    网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
  • 专题推荐

    作者信息

    php中文网

    认证0级讲师

    推荐视频教程
  • javascript初级视频教程javascript初级视频教程
  • jquery 基础视频教程jquery 基础视频教程
  • 视频教程分类