文字列を UTF-8 にエンコードする
文字列を UTF-8 にエンコードすると、さまざまなプラットフォームやアプリケーションで広く認識されている形式で表現できるようになります。ユーザーが直面する可能性のある課題の 1 つは、「ñ」などの特殊文字を使用して文字をエンコードすることです。これに対処するために、問題を詳しく調べて、文字列を UTF-8 に効果的にエンコードする解決策を検討してみましょう。
指定されたコード サンプル内:
byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8");
問題は、文字列はエンコードされます。 getBytes() メソッドはデフォルトで、プラットフォームのデフォルトの文字エンコーディングを使用して文字列をエンコードしますが、必ずしも UTF-8 であるとは限りません。したがって、「UTF-8」エンコーディングを使用して ptext バイト配列から新しい String オブジェクトを作成すると、文字表現が正しくなくなる可能性があります。
適切な UTF-8 エンコーディングを確保するには、StandardCharsets クラスの使用を検討してください。事前定義された文字エンコーディングを提供します。以下は、UTF-8 エンコーディングを使用して文字列をエンコードする方法を示すコード スニペットです。
ByteBuffer byteBuffer = StandardCharsets.UTF_8.encode(myString)
StandardCharsets.UTF_8 定数は UTF-8 文字エンコーディングを表し、encode() メソッドは次の内容を含む ByteBuffer を返します。エンコードされたバイト。このアプローチにより、文字列、特に他のエンコード方法では課題となる可能性がある「ñ」のような文字の正確な UTF-8 エンコードが保証されます。
以上がJava で文字列を確実に UTF-8 にエンコードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。