Heim > häufiges Problem > Der interne Code eines chinesischen Zeichens erfordert mehrere Bytes zum Speichern

Der interne Code eines chinesischen Zeichens erfordert mehrere Bytes zum Speichern

青灯夜游
Freigeben: 2023-02-08 13:50:33
Original
93525 Leute haben es durchsucht

Der interne Code eines chinesischen Schriftzeichens erfordert 2 Bytes zum Speichern. Im beliebten chinesischen Zeichensystem in China belegt der interne Code eines chinesischen Zeichens 2 Bytes, da das chinesische Zeichenverarbeitungssystem die Kompatibilität zwischen chinesischen und westlichen Sprachen sicherstellen muss, wenn es sowohl ASCII-Codes als auch nationale Standardcodes für chinesische Zeichen gibt System wird es zu Mehrdeutigkeiten kommen. Zu diesem Zweck sollte der interne Code für chinesische Zeichen entsprechend verarbeitet und in den nationalen Standardcode umgewandelt werden.

Der interne Code eines chinesischen Zeichens erfordert mehrere Bytes zum Speichern

Die Betriebsumgebung dieses Artikels: Windows 10-System, Thinkpad T480-Computer.

Wie viele Bytes werden benötigt, um den internen Code eines chinesischen Schriftzeichens zu speichern?

Der interne Code eines chinesischen Schriftzeichens erfordert 2 Bytes zum Speichern.

Das National Bureau of Standards meines Landes veröffentlichte im Mai 1981 den „Chinese Character Coded Character Set for Information Exchange – Basic Set“ mit dem Codenamen GB2312-80, der insgesamt 6763 chinesische Schriftzeichen und 682 grafische Zeichen kodierte. Das Prinzip ist: Chinesische Schriftzeichen werden durch zwei Bytes dargestellt.

Im Prinzip können zwei Bytes 256×256=65536 verschiedene Symbole darstellen, was als Grundlage für die Darstellung der chinesischen Zeichenkodierung machbar ist. Angesichts der Beziehung zwischen der Kodierung chinesischer Zeichen und anderen internationalen Universalkodierungen, wie z. B. der Kodierung westlicher ASCII-Zeichen, hat das National Bureau of Standards meines Landes jedoch ein modifiziertes Zwei-Byte-Kodierungsschema für chinesische Zeichen übernommen, bei dem nur die unteren 7 Bits der beiden Bytes verwendet werden.

Diese Lösung kann 128×128=16384 verschiedene chinesische Zeichen aufnehmen, aber um mit Standard-ASCII-Codes kompatibel zu sein, können 32 Steuerfunktionscodes, Leerzeichen mit einem Codewert von 32 und Opcodes von 127 nicht in jedem Byte verwendet werden. . Es können also nur 94 Kodierungen pro Byte vorhanden sein. Auf diese Weise beträgt die tatsächliche Anzahl der Wörter, die durch doppelte sieben Ziffern dargestellt werden können, 94×94=8836.

Der interne Code eines chinesischen Zeichens erfordert mehrere Bytes zum Speichern

Weitere verwandte Artikel finden Sie auf der Chinesischen PHP-Website! !

Das obige ist der detaillierte Inhalt vonDer interne Code eines chinesischen Zeichens erfordert mehrere Bytes zum Speichern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage