Maison > Java > JavaBase > La différence entre les caractères et les octets en Java

La différence entre les caractères et les octets en Java

王林
Libérer: 2019-11-12 14:37:37
original
2959 Les gens l'ont consulté

La différence entre les caractères et les octets en Java

byte (byte):

byte signifie octet, qui est le type de données de base en Java et est utilisé pour déclarer les octets Type variable, un octet contient 8 bits, la plage de valeurs du type d'octet est donc comprise entre -128 et 127.

Habituellement, lors de la lecture de fichiers non texte (tels que des images, des sons, des fichiers exécutables), vous devez utiliser des tableaux d'octets pour enregistrer le contenu des fichiers. Lors du téléchargement de fichiers, les tableaux d'octets sont également utilisés comme tampon temporaire. réception. Contenu du fichier, donc l’octet est essentiel dans les opérations sur les fichiers.

Dans certains programmes (en particulier ceux liés au matériel), certaines données seront stockées dans des variables de type octet, telles que 00110010, où chaque bit représente un paramètre, puis des opérations sur les bits sont effectuées Méthode pour obtenir et attribuer des valeurs aux paramètres.

Caractère :

La machine ne connaît que les octets, mais les caractères sont des unités sémantiques. Ils sont codés en 1, 2 voire 3 4 octets. Ceci est lié au codage du jeu de caractères. Les lettres et les chiffres anglais sont codés sur un seul octet, mais les caractères des langues naturelles telles que les caractères chinois sont multi-octets. Un octet ne peut représenter que 255 caractères et il ne peut pas être utilisé pour traiter autant de langues naturelles dans le monde, un stockage multi-octets est donc absolument nécessaire.

Ainsi, dans l'entrée et la sortie des fichiers, InputStream et OutputStream traitent des flux d'octets, ce qui signifie que tout est supposé être des octets binaires ; tandis que Reader et Writer sont des flux de caractères, qui impliquent un problème de définition de caractères ; Conformément aux normes de codage ANSI, les signes de ponctuation, les chiffres et les lettres majuscules et minuscules occupent tous un octet et les caractères chinois occupent 2 octets. Selon la norme UNICODE, tous les caractères occupent 2 octets.

Tutoriel recommandé : Tutoriel Java

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal