如何在 Java 中可靠地將字串編碼為 UTF-8？-java教程-PHP中文網

如何在 Java 中可靠地將字串編碼為 UTF-8？

Barbara Streisand

發布： 2024-12-05 16:14:14

原創

976 人瀏覽過

How Can I Reliably Encode Strings to UTF-8 in Java?

將字串編碼為UTF-8

將字串編碼為UTF-8 使其能夠以各種平台和應用程式廣泛識別的格式表示。使用者可能遇到的一項挑戰是使用“ñ”等特殊字元對字元進行編碼。為了解決這個問題，讓我們深入研究這個問題並探索一種有效地將字串編碼為 UTF-8 的解決方案。

在給定的程式碼範例中：

byte ptext[] = myString.getBytes();
String value = new String(ptext, "UTF-8");

登入後複製

問題在於字串已編碼。 getBytes() 方法預設使用平台的預設字元編碼對字串進行編碼，該編碼可能不會總是 UTF-8。因此，當您使用“UTF-8”編碼從 ptext 位元組數組建立新的 String 物件時，可能會導致字元表示不正確。

為了確保正確的 UTF-8 編碼，請考慮使用 StandardCharsets 類，它提供預先定義的字元編碼。下面的程式碼片段示範如何使用UTF-8 編碼對字串進行編碼：

ByteBuffer byteBuffer = StandardCharsets.UTF_8.encode(myString)

登入後複製

StandardCharsets.UTF_8 常數表示UTF-8 字元編碼，encode() 方法傳回一個ByteBuffer，其中包含編碼的位元組.這種方法可確保字串的準確 UTF-8 編碼，特別是對於像「ñ」這樣的字符，這可能會給其他編碼方法帶來挑戰。

以上是如何在 Java 中可靠地將字串編碼為 UTF-8？的詳細內容。更多資訊請關注PHP中文網其他相關文章！