Les informations sur les caractères chinois sont généralement stockées dans l'ordinateur sous forme de code interne. Le code interne des caractères chinois, également connu sous le nom de « code ASCII des caractères chinois », appelé « code interne », fait référence au code composé de symboles 0 et 1 utilisé dans le stockage interne, le traitement et la transmission des caractères chinois de l'ordinateur.
L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.
Les informations sur les caractères chinois sont généralement stockées dans l'ordinateur sous forme de code interne.
Une fois le code de saisie accepté, il sera converti en code interne par le « module de conversion de code de saisie » du système d'exploitation de caractères chinois, quelle que soit la méthode de saisie au clavier utilisée. Le code intégré à la machine est le codage le plus basique des caractères chinois. Quels que soient le système de caractères chinois et la méthode de saisie des caractères chinois, le code externe du caractère chinois saisi doit être converti en code intégré à la machine avant de pouvoir être utilisé. être stockés et traités de diverses manières.
Explication détaillée
Étant donné que le système de traitement des caractères chinois doit garantir la compatibilité entre les langues chinoises et occidentales, une ambiguïté se produira lorsque le code ASCII et le code standard national des caractères chinois existent dans le système. . Par exemple : il y a deux octets de contenu 30H et 21H, qui peuvent représenter le code standard national du caractère chinois « ah » et le code ASCII du « 0 » et du « ! » espagnols. Pour cette raison, le code des caractères chinois intégré à la machine doit être traité de manière appropriée et transformé en code standard national.
Le code intégré au code standard national est un code long de deux octets. Il ajoute « 1 » au bit le plus élevé de chaque octet du code standard national correspondant, c'est-à-dire
<.>Code de caractère chinois dans la machine = code standard national de caractère chinois + 8080HPar exemple, le code standard national du caractère « ah » mentionné ci-dessus est 3021H, et son code interne de caractère chinois est B0A1H. La base du code des caractères chinois dans la machine est le code standard national des caractères chinois. Code intégré : afin d'éviter les problèmes d'ambiguïté lorsque des codes ASCII et des codes standard nationaux sont utilisés en même temps, la plupart des systèmes de caractères chinois utilisent la position haute 1 de chaque octet du code standard national comme code machine pour les caractères chinois. Cela résout non seulement l'ambiguïté entre le code machine des caractères chinois et le code machine occidental, mais permet également au code machine des caractères chinois et au code standard national d'avoir une relation de correspondance très simple. La relation entre le code interne des caractères chinois, le code standard national et le code de localisation est la suivante : les deux octets du code de localisation (décimal) sont convertis en hexadécimal puis ajoutés avec 2020H pour obtenir le correspondant code standard national ; Le code interne est le bit le plus élevé des deux octets du code d'échange de caractères chinois (code standard national) plus 1 respectivement, c'est-à-dire que les deux octets du code d'échange de caractères chinois (code standard national) sont ajoutés avec 80H pour obtenir le code interne correspondant ; indicatif régional (décimal) Les deux octets sont convertis en hexadécimal puis A0H est ajouté pour obtenir le code interne correspondant. Pour plus d'articles connexes, veuillez visiter leSite Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!