Quelle est la forme de stockage des données de caractères en mémoire ?

青灯夜游
Libérer: 2021-06-03 11:57:27
original
25668 Les gens l'ont consulté

Les données de caractères sont stockées en mémoire en code ASCII. Les données de caractère consistent à placer une constante de caractère dans une variable de caractère. Elles ne placent pas le caractère lui-même dans l'unité de mémoire, mais placent le code ASCII correspondant du caractère dans l'unité de stockage.

Quelle est la forme de stockage des données de caractères en mémoire ?

L'environnement d'exploitation de ce tutoriel : système Windows 7, version c99, ordinateur Dell G3.

Les données de caractères sont stockées dans la mémoire sous forme de valeur de code ASCII, qui est un octet. Tous les types de données sont stockés dans la mémoire sous forme de codes binaires de 0 et 1. Ce principe ne changera pas.

En langage C, les données de type char consistent à mettre une constante de caractère dans une variable de caractère. Il ne s'agit pas de mettre le caractère lui-même dans l'unité de mémoire, mais de mettre le code ASCII correspondant du caractère. unité de stockage.

En codage, un caractère chinois nécessite 2 octets pour être stocké. En codage UTF-8, le stockage d'un caractère alphabétique anglais nécessite 1 octet, et le stockage d'un caractère chinois nécessite 3 à 4 octets. En codage UTF-16, le stockage d'un caractère alphabétique anglais ou d'un caractère chinois nécessite 2 octets. En codage UTF-32, le stockage de n'importe quel caractère dans le monde nécessite 4 octets.

Quelle est la forme de stockage des données de caractères en mémoire ?

Informations étendues :

ASCII ((American Standard Code for Information Interchange) : American Standard Code for Information Interchange) est un ensemble de codes informatiques basés sur le système d'alphabet latin principalement utilisé pour afficher l'anglais moderne et d'autres langues d'Europe occidentale. Il s’agit de la norme d’échange d’informations la plus courante et équivaut à la norme internationale ISO/IEC 646. La première fois que l'ASCII a été publié en tant que type standardisé, c'était en 1967, et la dernière mise à jour remonte à 1986. Jusqu'à présent, un total de 128 caractères ont été définis

Le code ASCII utilise le code 7 bits ou 8 bits spécifié. bits binaires Les tableaux sont combinés pour représenter 128 ou 256 caractères possibles. Le code ASCII standard, également appelé code ASCII de base, utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les contrôles spéciaux utilisés dans le caractère anglais américain [1. ] . Parmi eux :

0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spéciaux de communication (les autres sont des caractères affichables), comme les caractères de contrôle : LF (saut de ligne), CR (retour chariot) , FF (Saut de page), DEL (suppression), BS (retour arrière), BEL (anneau), etc. caractères spéciaux de communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation), etc. Les valeurs ASCII sont 8, 9, 10 et 13, respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte en fonction des différentes applications [1] .

32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.

65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.

A noter également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. La parité impaire stipule : le nombre de 1 dans un octet du code correct doit être un nombre impair, si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. La parité stipule : le nombre de 1 dans un octet du code ; le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 [1] au bit le plus élevé b7. Les 128 derniers caractères de

sont appelés codes ASCII étendus. De nombreux systèmes x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques.

Recommandations associées : "Tutoriel vidéo sur le langage C"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!