文字化けのない中国語傍受(2つの方法)
- //$str インターセプトされる文字列
- //$len インターセプトされる文字数
- //$chars インターセプトされた文字数
- //$res 保存されたstring
- // $chars はインターセプトされた文字列の数を格納します
- //$offset はインターセプトされたオフセットです
- //$length は文字列のバイト数です
- //$len>$str の文字数の場合、不要な while ループが発生します。 ($offsetfunction utf8sub($str,$len){
- if($len return ;
- }
- $res="";
- $ offset=0;
- $ chars=0;
- $length=strlen($str);
- while($chars
- $hign=decbin(ord(substr($str, $offset,1)) );
- if(strlen($hign) $count=1;
- }elseif(substr($hign,0,3)=="110"){
- $count =2;
- }elseif (substr($hign,0,4)=="1110"){
- $count=3;
- }elseif(substr($hign,0,5)=="11110"){
- $count=4;
- }elseif(substr($hign,0,6)=="111110"){
- $count=5;
- }elseif(substr($hign,0,7)=="1111110") {
- $count=6 ;
- }
-
- $res.=substr($str,$offset,$count);
- $offset+=$count;
- $chars+=1;
-
-
- }
- return $res;
- }
- function utf8sub1($ str,$len){
- $chars=0;
- $res="";
- $offset=0;
- $length=strlen($str);
- while($chars<$len && $offset<$length) {
- $hign=decbin(ord(substr($str,$offset,1)));
- if(strlen($hign)<8){
- $count=1;
- }elseif ($hign & "11100000 "=="11000000"){
- $count=2;
- }elseif($hign & "11110000"=="11100000"){
- $count=3;
- }elseif($hign & "11111000"==" 11110000"){
- $count=4;
- }elseif($hign & "11111100"=="11111000"){
- $count=5;
- }elseif($hign & "11111110"= ="11111100"){
- $count=6;
- }
- $res.=substr($str,$offset,$count);
- $chars++;
- $offset+=$count;
- }
- return $res;
- }
- $a="中华ah人hdj";
- echo utf8sub($a,5);
- ?>
コードをコピー
|