• 技术文章 >php教程 >php手册

    谈汉字转换类型及解决方案

    2016-06-13 11:20:42原创306
    ●简繁转换有四种情况
      汉字转换,分为内码转换和简繁转换。
      内码转换属于简繁转换,但是他主要是在GB码和BIG5码之间转换。
      另外一种简繁转换是在GB码内部的转换。GB码扩展集包含两万多个汉字,自然也存在简繁转化问题。例如,大陆网友从BIG5码繁体字网页用“复制--粘贴”的方法虽然得到的是繁体字文件,但他已经不是BIG5码的字体了。尽管页面的内码是BIG5码,但是经过复制--粘贴,已经变成了GB内码的繁体字,粘贴到“笔记本”时不是乱码,要知道,大陆简体windows系统的笔记本,是不能识别BIG5码的。若要把这繁体字变为简体字,用一般的方法可就不行了。
      所以,不要以为繁体字就都是BIG5码。因此,汉字转换分为四种情况:
      1。GB转BIG5
      2。BIG5转GB
      3。简体字转繁体字(在GBK大陆内码中转换)
      4。繁体字转简体字(同上)
    ●网页“另存为”的转换特点。利用网页“另存为”转换汉字内码。
      当我们把某个BIG5的网页用“另存为”的方式保存时,你注意看,“保存WEB页”窗口最下方有个“编码”栏,里面至少有三种选择:Unicode(UTF-8),繁体中文(BIG5),简体中文(GB2312)。
    本网页的内码是Unicode(UTF-8),所以能够同时显示GB码和 BIG5码汉字。你选择不同的内码保存,就已经进行了内码转换。利用这个特点,我们可以用网页“另存为”转换汉字内码。
    ●网上在线汉字转换,大多是内码转换。若想把复制下来的GB码繁体字转换为同内码的简体字,或者相反,网上的转换功能显然不足。
    ●《金山快译》包含两个文件:KConvert.exe和Cjktab32.dll,总共大小才484K,压缩成RAR文件後仅仅235K。可以直接提取出来单独使用。他可以进行上述四种汉字的任意转换。
      我已将金山快译的这两个文件上传,要用的网友可以下载。
    金山快译的内码转换(解压可用,无须安装)
    ■http://202.202.4.200/upload/upfile/gb-big5.rar■
    ●手工修改个别字
      不过,绝大多数汉字转换软件有个小问题,简体到繁体自动转换时,个别字转换有毛病(一对多的毛病),姓范的范,会转换成模
    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    上一篇:在静态页面中实现点击数统计 下一篇:PHP&Java(1)
    VIP课程(WEB全栈开发)

    相关文章推荐

    • 【活动】充值PHP中文网VIP即送云服务器• 53个要点提高PHP编程效率,53php编程效率• php批量添加数据与批量更新数据的实现方法,php添加数据• php的数据数据类型• php上传图片之时间戳命名(保存路径),• 大型网站架构演变和知识体系
    1/1

    PHP中文网