php获取utf8字符串的字符长度实例

WBOY

Libérer： 2016-05-26 08:21:06

original

1498 Les gens l'ont consulté

今天没事来研究了一下在php中利用strlen计算字符串长度的一些实例了,但经过测试使用php自带的函数strlen在uft8与gbk编码时有很大的区别,下面我们一起来看看具体测试实例.

今晚在写框架的表单验证类时,需要判断某个字符串长度是否在指定区间内,很自然地，想到了PHP中的strlen函数,代码如下:

$str = &#39;Hello world!中&#39;; 
echo strlen($str); // 输出12 
测试一下中文 
$str = &#39;你好，世界！&#39;; 
echo strlen($str); // GBK或GB2312下输出12，UTF-8下输出18

Copier après la connexion

PHP内置的字符串长度函数strlen无法正确处理中文字符串,它得到的只是字符串所占的字节数,对于GB2312的中文编码,strlen得到的值是汉字个数的2倍,而对于UTF-8编码的中文,就是3倍的差异了,在 UTF-8编码下,一个汉字占3个字节.

下面这个实例摘自大名鼎鼎的WordPress,非常精确的,另外需要注意的是本函数仅适用于utf-8 编码下的字符串,代码如下:

function utf8_strlen($string=null){ 
// 将字符串分解为单元 
preg_match_all("/./us", $string, $match); 
// 返回单元个数    
return count($match[0]); 
}

Copier après la connexion

但以上代码在UTF-8编码下并不能处理GBK/GB2312的中文字符串,因为GBK/GB2312的中文字符会被识别为两个字符而计算出来的中文字符数量会翻倍,于是我想到了这么一个办法,代码如下:

$tmp = @iconv(&#39;gbk&#39;, &#39;utf-8&#39;, $str); 
if(!emptyempty($tmp)){ 
$str = $tmp; 
} 
preg_match_all(&#39;/./us&#39;, $str, $match); 
echo count($match[0]);

Copier après la connexion

可兼容GBK/GB2312及UTF-8编码,经小量数据测试通过,但暂未确定是否完全正确.

文章网址:

随意转载^^但请附上教程地址。

Php8, je viens aussi

Apprenez la mise en page d'un site Web en 30 minutes

Tutoriel vidéo Shangguan Oracle débutant à compétent

Votre première ligne de code UNI-APP

Flutter de zéro au lancement de l'application

Brother Lian Nouveau didacticiel vidéo Linux

Tutoriel vidéo AXURE 9 (convient à l'interface utilisateur interactive de conception de produits du chef de produit)

Tutoriel vidéo PS Zero Basic Proficiency

Tutoriel vidéo de 16 jours sur l'interface utilisateur pour vous aider à démarrer

Tutoriel vidéo sur les techniques PS et les techniques de découpage

Tutoriel vidéo sur la construction et le lancement de projets d'Alibaba Cloud Environment

Présentation des réseaux informatiques - Connaissances de base que les programmeurs doivent maîtriser

Tutoriel essentiel pour les programmeurs - Explication du protocole HTTP

Tutoriel vidéo Websocket

php获取utf8字符串的字符长度实例