L'énigme du jeu de caractères par défaut en Java
En Java, il semble y avoir une incohérence dans la récupération du jeu de caractères par défaut utilisé par la plate-forme. Cette incohérence est due à l'utilisation de deux ensembles distincts de propriétés système et à une différence entre les versions de Java.
Propriétés système
Java conserve deux jeux de caractères par défaut basés sur le système. propriétés :
Différence de version Java
Dans Java 5, Charset.defaultCharset() La méthode renvoie le jeu de caractères mis en cache en fonction de la propriété système file.encoding, qui peut être remplacée pendant l'exécution. Cependant, le jeu de caractères par défaut utilisé par les classes d'E/S reste inchangé.
En revanche, Java 6 a introduit un changement où Charset.defaultCharset() utilise une valeur mise en cache du jeu de caractères par défaut, qui reflète correctement l'encodage. utilisé par les classes d'E/S.
Résultats en Java 5
Sur la base de l'exemple de code fourni dans la question, les résultats suivants sont observés en Java 5 :
Default Charset=ISO-8859-1 file.encoding=Latin-1 Default Charset=UTF-8 Default Charset in Use=ISO8859_1
Ici, Charset.defaultCharset() renvoie initialement "ISO-8859-1" en raison de la valeur mise en cache. La définition de file.encoding sur « Latin-1 » ne met pas à jour cette valeur mise en cache. En conséquence, Charset.defaultCharset() continue de renvoyer « UTF-8 », tandis que OutputStreamWriter utilise toujours « ISO8859_1 » comme codage par défaut.
Bug ou fonctionnalité ?
Cette différence est considérée comme un bug ou un choix de conception intentionnel dans Java 5. Dans Java 6 et les versions ultérieures, le problème est résolu en synchronisant et en mettant correctement en cache le jeu de caractères par défaut, conduisant à un comportement cohérent entre Charset.defaultCharset() et le Classes d'E/S.
Recommandation
Malgré l'incohérence de Java 5, il est fortement recommandé d'éviter de s'appuyer sur Charset.defaultCharset() en raison de son implémentation dépendante nature. Utilisez plutôt des déclarations de jeu de caractères explicites lorsque vous travaillez avec des données texte.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!