Java の UTF-16 エンコーディングのサロゲート
Java の StringBuffer クラスは、Unicode 文字の反転を処理する reverse() メソッドを提供します。サロゲートペアも含みます。このコンテキストでは、サロゲート ペアを理解することが重要です。
サロゲート ペアとは何ですか?
サロゲート ペアは、Unicode を表すために UTF-16 エンコード スキームで使用されるメカニズムです。コード ポイントが 0xFFFF を超える文字。
内部 UTF-16エンコーディング
Java は、16 ビット (2 バイト) コード単位を使用する UTF-16 エンコーディングを使用して文字列を格納します。ただし、Unicode 文字は、UTF-16 の容量を超える最大 0x10FFFF のコード ポイントを持つことができます。
高コード ポイントのサロゲート
サロゲートはエンコードに使用されます。これらの高いコードポイント。これらには 2 つの範囲があります:
サロゲート ペアは、上位サロゲートと下位サロゲートを組み合わせて形成されます。これにより、合計 65,536 (2^16) の高コードポイント範囲が可能になります。
以上がJava の StringBuffer Reverse() メソッドは UTF-16 エンコーディングのサロゲート ペアをどのように処理しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。