• 技术文章 >后端开发 >php教程

    PHP实现通过中文字符比率来判断垃圾评论的方法_PHP

    2016-05-31 19:29:12原创280
    本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:

    一、需求:

    最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

    二、解决方案:

    要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。

    三、实现代码:

    代码如下:

    $len_all = strlen($comment['text']);
    $len_st = mb_strlen($comment['text'], 'UTF-8');
    if(($len_all-$len_st)/(2*$len_st) < 0.5){
    $error = "中文字符少于百分之五十";
    }

    如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

    希望本文所述对大家的PHP程序设计有所帮助。

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:PHP 判断 垃圾评论 方法
    上一篇:php实现删除指定目录下相关文件的方法_PHP 下一篇:PHP启动windows应用程序、执行bat批处理、执行cmd命令的方法(exec、system函数详解)_PHP
    VIP课程(WEB全栈开发)

    相关文章推荐

    • 【腾讯云】年中优惠,「专享618元」优惠券!• PHP header发送各种类型文件上载 • php资料可以用html调用打开吗 • PHP读写资料代码 • 有没有PHP下传多张图片的源码学习一上 • 在windows7上安装discuz!2x
    1/1

    PHP中文网