Le type de caractère Java utilise le schéma de codage Unicode.
Java utilise le codage UTF-16 comme code interne, ce qui signifie qu'à l'intérieur de la JVM, le texte est représenté par une séquence d'éléments de code de 16 bits. Les textes couramment utilisés sont des caractères (char) et des chaînes (String). constantes. Cependant, UTF-16 est un schéma de codage du jeu de caractères Unicode.
Les caractères et chaînes Java existent aux endroits suivants :
● Le fichier de code source Java, *.java, peut être n'importe quel codage de caractères, tel que GBK, UTF-8
● Fichier de classe, *.class, utilise un encodage UTF-8 modifié (UTF-8 modifié)
● JVM, utilise l'encodage UTF-16 en mémoire
Le compilateur Java doit lire correctement le code source, éliminer les différences d'encodage, puis le compiler dans un fichier de classe codé en UTF-8. Par exemple, javac prendra l'encodage du système d'exploitation par défaut. Vous pouvez utiliser le paramètre -encoding pour spécifier l'encodage des caractères du fichier source. JVM charge le fichier Class et convertit les caractères ou les chaînes qu'il contient en séquences de codage UTF-16.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!