php 字元編碼轉換類別的相關內容

jacklove
發布: 2023-03-31 08:06:01
原創
2161 人瀏覽過

php 字元編碼轉換類,支援ANSI、Unicode、Unicode big endian、UTF-8、UTF-8 Bom 互相轉換。

四種共同文字檔案編碼方式

#ANSI編碼

無檔案頭(檔案編碼開頭標誌性位元組)

#ANSI編碼字母數字佔一個位元組,漢字佔兩個位元組

回車換行符,單字節, 十六進位表示為0d 0a

UNICODE編碼:

檔頭,十六進位表示為FF FE

#每個字元都用兩個位元組編碼

#回車換行符, 雙字節,十六進位表示為000d 000a

#Unicode big endian編碼:

檔案頭十六進位表示為FE FF

後面編碼是把字元的高位元放在前面,低位放在後面,剛好和Unicode編碼顛倒

回車換行符,雙位元組,十六進位表示為0d00 0a00

UTF-8 編碼:

檔案頭,十六進位表示為EF BB BF

UTF-8是Unicode的一種變長字元編碼,數字、字母、回車、換行都用一個位元組表示,漢字佔3個位元組

回車換行符,單字節,十六進位表示為0d 0a

轉換原理:先把字元編碼轉為UTF-8,然後再從UTF-8轉換為對應的字元編碼。

CharsetConv.class.php

#
_allow_charset)){ $this->_in_charset = $in_charset; } // 检查输出编码 if(in_array($out_charset, $this->_allow_charset)){ $this->_out_charset = $out_charset; } } /** 转换 * @param String $str 要转换的字符串 * @return String 转换后的字符串 */ public function convert($str){ $str = $this->convToUtf8($str); // 先转为utf8 $str = $this->convFromUtf8($str); // 从utf8转为对应的编码 return $str; } /** 把编码转为UTF-8编码 * @param String $str * @return String */ private function convToUtf8($str){ if($this->_in_charset=='utf-8'){ // 编码已经是utf-8,不用转 return $str; } switch($this->_in_charset){ case 'utf-8bom': $str = substr($str, 3); break; case 'ansi': $str = iconv('GBK', 'UTF-8//IGNORE', $str); break; case 'unicode': $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2)); break; case 'unicodebe': $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2)); break; default: break; } return $str; } /** 把UTF-8编码转换为输出编码 * @param String $str * @return String */ private function convFromUtf8($str){ if($this->_out_charset=='utf-8'){ // 输出编码已经是utf-8,不用转 return $str; } switch($this->_out_charset){ case 'utf-8bom': $str = "\xef\xbb\xbf".$str; break; case 'ansi': $str = iconv('UTF-8', 'GBK//IGNORE', $str); break; case 'unicode': $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str); break; case 'unicodebe': $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str); break; default: break; } return $str; } } // class end ?>
登入後複製

##demo:unicode big endian 轉為utf-8 bom

convert($str); file_put_contents('response/utf-8bom.txt', $response, true); ?>
登入後複製
php 字元編碼轉換類,支援ANSI、Unicode、Unicode big endian、UTF-8、UTF-8 Bom 互相轉換的相關內容,更多相關內容請追蹤php中文網。

相關推薦:

php str_replace 取代指定次數方法的解說

關於header,headers_sent,headers_list,header_remove 使用說明

透過PDO 查詢mysql傳回欄位整數變成String型的解決方法

以上是php 字元編碼轉換類別的相關內容的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!