文字とは、さまざまな国の文字、句読点、図記号、数字などを含む、さまざまな文字や記号の総称です。 文字セット (文字セット) は、複数の文字の集合です。各文字セットには、異なる数の文字が含まれています: ASCII 文字セット、GB2312 文字セット、 GB18030 文字セット、Unicode 文字セットなどコンピューターがさまざまな文字セットのテキストを正確に処理するには、コンピューターがさまざまなテキストを認識して保存できるように文字エンコーディングが必要です。中国語の文字は数多くあり、その表記規則が異なる簡体字中国語と繁体字中国語の2種類に分けられます。コンピュータはもともと英語の半角文字をベースに設計されているため、中国語の文字をエンコードすることが技術的な要素となります。中国の情報交換の拠点です。
この記事では、iconvを介してstringをGBKからUTF8文字セットに変換するPHPを主に紹介します。非常に優れた参考値です。以下のエディターで見てみましょう
PHP は、iconv を通じて文字列を GBK から UTF8 文字セットに変換します。
1. iconv() の概要
iconv 関数 は、既知の文字セット ファイルを別の既知の文字セット ファイルに変換できます。例: GB2312 から UTF-8 に変換します。
iconv関数はphp5に組み込まれており、デフォルトでGB文字セットがオンになっています。
2. iconv() エラー
iconv は文字「-」を gb2312 に変換するときにエラーを起こします。解決策は、変換する必要があるエンコーディングの後に「//IGNORE」を追加することです。 iconv 関数のパラメータ After:
iconv("UTF-8", "GB2312//IGNORE", $data)
ignore は、変換中にエラーを無視することを意味します。ignore パラメータがないと、この文字に続くすべての文字列を保存できません。
3. iconv() の例
<?php echo $str= ‘你好,这里是卖咖啡!'; echo '<br />'; echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8 echo '<br />'; echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符个数截取而非字节 print_r(iconv_get_encoding()); //得到当前页面编码信息 echo iconv_strlen($str, 'UTF-8'); //得到设定编码的字符串长度 ?>
以上がPHPで文字セットを変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。