Bei der UTF-8-Codierung entspricht ein chinesisches Zeichen drei Bytes, ein chinesisches Satzzeichen entspricht einem Byte und ein englisches Satzzeichen entspricht einem Byte Ein-Wort-Festival.
Die Betriebsumgebung dieses Artikels: Windows 10-System, DELL G3-Computer.
In der UTF-8-Codierung: Ein chinesisches Zeichen entspricht drei Bytes und chinesische Satzzeichen belegen drei Bytes.
Ein englisches Zeichen entspricht einem Byte und die englische Interpunktion belegt ein Byte.
Unicode-Kodierung: Ein englisches Wort entspricht zwei Bytes und ein chinesisches Zeichen (einschließlich traditionellem Chinesisch) entspricht zwei Bytes. Die chinesische Zeichensetzung belegt zwei Bytes und die englische Zeichensetzung zwei Bytes.
Erweiterte Informationen:
UTF-8 verwendet 1~4 Bytes zum Kodieren jedes Zeichens:
1. Ein US-ASCIL-Zeichen benötigt nur 1 Byte zum Kodieren (Unicode-Bereich ist U+0000~U+007F).
2. Lateinische, griechische, kyrillische, armenische, hebräische, arabische, syrische und andere Buchstaben mit diakritischen Zeichen erfordern eine 2-Byte-Kodierung (Unicode-Bereich ist U+0080~U +07FF).
3. Zeichen in anderen Sprachen (einschließlich chinesischer, japanischer und koreanischer Zeichen, südostasiatischer Zeichen, nahöstlicher Zeichen usw.) umfassen die am häufigsten verwendeten Zeichen und verwenden eine 3-Byte-Codierung.
4. Andere selten verwendete Sprachzeichen verwenden eine 4-Byte-Kodierung.
Für mehr Computerwissen besuchen Sie bitte die FAQ-Kolumne!
Das obige ist der detaillierte Inhalt vonWie viele Bytes belegen chinesische Zeichen bei der UTF8-Codierung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!