如果是BIG5格式的还可以用'mb_detect_encoding'来检测,但是全部统一为UTF-8以后,就没办法用这个函数检测了,是否有其它办法来检测某段文字是否为繁体字。或者退一步来讲,是否有办法把一段文字中的繁体字全部自动转化为简体字?
业精于勤,荒于嬉;行成于思,毁于随。
可以把一段文字中的繁体字全部自动转化为简体字
` $in = "繁体繁體"; $in = iconv('UTF-8', 'BIG5//TRANSLIT', $in); $in = iconv('BIG5', 'GB2312//TRANSLIT', $in); $out = iconv('GB2312', 'UTF-8//TRANSLIT', $in); var_dump($out); ` 备注:数据源是UTF-8
如果要求不高可以自己建立个字典替换:
$map = array( '兒' => '儿', '幾' => '几', '麼' => '么', /* ... */ ); /*自己查找替换*/ $str = '兒童';
或者使用其他的转换插件,比如openccc的php扩展:http://code.google.com/p/opencc/
可以把一段文字中的繁体字全部自动转化为简体字
`
$in = "繁体繁體";
$in = iconv('UTF-8', 'BIG5//TRANSLIT', $in);
$in = iconv('BIG5', 'GB2312//TRANSLIT', $in);
$out = iconv('GB2312', 'UTF-8//TRANSLIT', $in);
var_dump($out);
`
备注:数据源是UTF-8
如果要求不高可以自己建立个字典替换:
或者使用其他的转换插件,比如openccc的php扩展:http://code.google.com/p/opencc/