java - UTF-16编码问题

Question

{代码...} Unicde编码中不明白的，像UTF-8/UTF-32中str4编码后字节数都是str1+str2+str3，但UTF-16则不然，UTF-16到底是如何编码的呢？求赐教。

黄舟 · Answer

UTF-16是可变长度的，最少为两个字节的编码格式。因为是两个字节，就牵扯到Big Endian和Small Endian。你上面的例子因为没有指定endianess，所以加上两个字节的BOM。再加上原来字符(ASCII)编码的两个字节，所以是4个字节。如果用utf-16-le或者utf-16-be，就会是两个字节。具体Java如何表示请自查。

怪我咯 · Answer

UTF-16解码后

feff0061 //a
feff0062 //b
feff0063 //c
feff006100620063 //abc

开头都有feff，其用来表示该字符串是大端(高位字节放前面)，之所以有这个标示是因为系统中存在大端和小端(高位字节在后面)两种模式，大端中0x01 0x02读取为0x0102，而同样的值在小端下读取值则为0x0201，不同，所以需要在feff来标示。

Php8, saya datang juga

Ketahui reka letak tapak web dalam masa 30 minit

Tutorial Video Permulaan Shangguan Oracle kepada Mahir

Baris pertama kod UNI-APP anda

Berkibar dari awal ke pelancaran apl

Tutorial Video Linux Baharu Brother Lian

Tutorial Video AXURE 9 (Sesuai untuk UI Reka Bentuk Produk Interaktif Pengurus Produk)

Tutorial Video PS Kemahiran Asas Sifar

Tutorial video UI 16 hari untuk anda bermula

Tutorial Video Teknik PS dan Teknik Menghiris

Tutorial Video Pembinaan Persekitaran Awan Alibaba dan Pelancaran Projek

Gambaran Keseluruhan Rangkaian Komputer - Pengetahuan Asas yang Perlu Dikuasai Pengaturcara

Tutorial Penting untuk Pengaturcara - Penjelasan Protokol HTTP

Tutorial Video Websocket