Perwakilan Dalaman Java bagi Rentetan
Java menggunakan UTF-16 untuk perwakilan teks dalamannya. Ini bermakna setiap aksara dalam rentetan Java dikodkan menggunakan unit kod Unicode 16-bit. Perwakilan ini membolehkan Java menyokong pelbagai jenis aksara, termasuk daripada abjad bukan Latin.
UTF-8 yang diubah suai untuk Pensiri
Sementara Java menggunakan UTF-16 secara dalaman, ia menggunakan versi UTF-8 yang diubah suai untuk siri rentetan. Format UTF-8 yang diubah suai ini memastikan keserasian dengan sistem lain yang menggunakan pengekodan UTF-8, seperti pelayar web. Untuk perwakilan data luaran, Java biasanya mengikut CESU-8 yang ketat.
Perwakilan Aksara dalam Memori
Satu aksara dalam Java, diwakili sebagai jenis char primitif, menduduki dua bait dalam ingatan. Ini tidak kira titik kod Unicode watak itu. Titik kod yang lebih tinggi daripada 65535 memerlukan dua aksara, menghasilkan perwakilan 4-bait dalam ingatan.
Dalam keadaan tertentu, Java mungkin menggunakan teknik mampatan yang dipanggil UseCompressedStrings. Teknik ini membenarkan pengekodan ISO-8859-1 8-bit untuk rentetan yang tidak memerlukan UTF-16. Walau bagaimanapun, ini ialah pengoptimuman khusus pelaksanaan dan bukan perwakilan dalaman lalai untuk rentetan.
Atas ialah kandungan terperinci Bagaimanakah Java Mewakili Rentetan Secara Dalaman?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!