java - UTF-16编码问题

Question

{代码...} Unicde编码中不明白的，像UTF-8/UTF-32中str4编码后字节数都是str1+str2+str3，但UTF-16则不然，UTF-16到底是如何编码的呢？求赐教。

黄舟 · Answer

UTF-16是可變長度的，最少為兩個位元組的編碼格式。因為是兩個字節，就牽扯到Big Endian和Small Endian。你上面的例子因為沒有指定endianess，所以加上兩個位元組的BOM。再加上原來字元(ASCII)編碼的兩個位元組，所以是4個位元組。如果用utf-16-le或utf-16-be，就會是兩個位元組。具體Java如何表示請自查。

怪我咯 · Answer

UTF-16解碼後

feff0061 //a
feff0062 //b
feff0063 //c
feff006100620063 //abc

開頭都有feff，其用來表示該字串是大端(高位元組放前面)，之所以有這個標示是因為系統中存在大端和小端(高位位元組在後面)兩種模式，大端0x01 0x02讀取為0x0102，而同樣的值在小端下讀取值則為0x0201，不同，所以需要在feff來標示。

php8，我來也

30分鐘學會網站佈局

尚觀Oracle入門到精通視頻教程

你的第一行UNI-APP程式碼

Flutter 從頭到應用程式啟動

兄弟連新版Linux視頻教程

AXURE 9影片教學（適用於產品經理互動產品設計UI）

零基礎PS影片教學

16天帶你入門UI視頻教程

PS技巧和切片技巧影片教學

阿裡雲環境搭建以及項目上線視頻教程

電腦網路概述－程式設計師必須掌握的基礎知識

程式設計師必備教學——HTTP協定講解

Websocket影片教學