技术文章 > 后端开发 > php教程

php截取字符串之截取utf8或gbk编码的中英文字符串示例_PHP教程

原创: 2016-07-13 10:36:03 816浏览

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。
php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。
mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。
google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$charset 只支持gbk与utf-8。

复制代码代码如下:

$a = "s＠@你好";
var_dump(strlen_weibo($a,'utf-8'));

结果输出为8，其中字母s计数为1，全角＠计数为2，半角@计数为1，两个中文计数为4。源码如下：

复制代码代码如下:

function strlen_weibo($string, $charset='utf-8')
{
$n = $count = 0;
$length = strlen($string);
if (strtolower($charset) == 'utf-8')
{
while ($n {
$currentByte = ord($string[$n]);
if ($currentByte == 9 ||
$currentByte == 10 ||
(32 {
$n++;
$count++;
} elseif (194 {
$n += 2;
$count += 2;
} elseif (224 {
$n += 3;
$count += 2;
} elseif (240 {
$n += 4;
$count += 2;
} elseif (248 {
$n += 5;
$count += 2;
} elseif ($currentByte == 252 || $currentByte == 253)
{
$n += 6;
$count += 2;
} else
{
$n++;
$count++;
}
if ($count >= $length)
{
break;
}
}
return $count;
} else
{
for ($i = 0; $i {
if (ord($string[$i]) > 127)
{
$i++;
$count++;
}
$count++;
}
return $count;
}
}

php 字符串 utf8 中英文 gbk PHP课程 HTML视频教程 CSS视频 JS视频教程 Vue视频教程

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。

上一条：php实现快速排序的三种方法分享_PHP教程下一条：php多功能图片处理类分享_PHP教程

相关文章

查看更多

热门课程

Laravel 9 学习正当时—保姆级教程，想学不会都难！

￥229
￥279

已抢66906个
抢
前端基础到实战（HTML5+CSS3+ES6+NPM）

￥800
￥1200

已抢39519个
抢
PHP基础到实战（PHP+MySQL）

￥800
￥1200

已抢21919个
抢
PHP入门到实战消息队列RabbitMQ

￥59
￥99

已抢2777个
抢
C#+WPF上位机开发课程（模块化与反应式编程）

￥246
￥499

已抢3290个
抢
在线商城系统开发（Laravel实战五）

￥159
￥299

已抢19402个
抢

打开APP，随时随地在线学习！