• 技术文章 >常见问题

    一个汉字的机内码需要几个字节储存

    青灯夜游青灯夜游2021-01-28 18:35:31原创18200

    一个汉字的机内码需要2个字节储存。在国内流行的汉字系统中,一个汉字的机内码占2个字节。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。为此,汉字机内码应对国标码加以适当处理和变换。

    本文操作环境:windows10系统、thinkpad t480电脑。

    一个汉字的机内码需要2个字节储存。

    我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示。

    原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。

    这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。

    1.jpg

    想要查阅更多相关文章,请访问PHP中文网!!

    以上就是一个汉字的机内码需要几个字节储存的详细内容,更多请关注php中文网其它相关文章!

    声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理
    专题推荐:汉字 机内码
    上一篇:an是什么软件 下一篇:数据分析方法有哪几种
    大前端线上培训班

    相关文章推荐

    • php utf-8汉字如何转拼音• 计算机中目前最普遍使用的汉字字符编码是什么• 详解开发一个Atom插件的流程• 汉字在计算机中是以什么形式输出的• 小程序开发的具体流程是什么

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网