objective-c - C语言或OC或C++ 中英文混合的文件读取前3个字符怎么做?
黄舟
黄舟 2017-04-17 11:42:25
0
4
479

1.txt 文件内容: 你好a,我是千叶!
期望结果: 你好a

C#include  main() { FILE *fp; fp=fopen("1.txt","r"); char x[1000]; fread(x,sizeof(char),7,fp); //length=7,对于现在的1.txt结果正确,如果1.txt变成纯中文的文件,第三个汉字就会被截断,请问要怎么处理呢? printf("%s",x); }

====================================================================================

我的场景是文件比较大,不太想把整个文件读取到NSData或者NSString,所以希望NSData读取部分数据,再转化成NSString,于是就遇到了中文字符截取出现问题的情况。看了大家的回答,发现这个问题可能是个伪命题,毕竟文件的偏移是按字节算的不会去考虑文件字符编码。

之前提了一个问题在Object-c节点,没有人回答 所以想看看用C能不能解决,原问题:http://segmentfault.com/q/1010000002530834?_ea=128095

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复 (4)
Peter_Zhu

提供个思路:

  1. 读取文件,你必须知道字符编码
  2. 生成NSString 对象,NSString 有个初始化方法是initWithData:encoding:,然后 NSData 有个初始化方法是dataWithContentsOfFile:
  3. 确保步轴2 正常生成对象后,调用 NSString 的成员方法:substringWithRange:进行截取

希望能帮到lz

    左手右手慢动作

    问题的重点在于:ANSI 编码的条件下,一个汉字占两个字节,一个英文字符占一个字节

    那么对于你说的例子:

    // 1.txt 你好a,我是千叶! ^^^^^ // "你好a", 数一数,是5个字节。

    所以如果你想截取"你好a", 那么使用:

    cfread(x,sizeof(char),5,fp); printf("%s\n", x); // 输出 "你好a"

    如果全是中文,例如:

    // 1.txt 你好啊,我是千叶! ^^^^^^ // 三个汉字是 6 个字节

    那么你如果想要汉字不被截断,至少应该读取偶数个字节

    cfread(x,sizeof(char),6,fp); printf("%s\n", x); // 输出 "你好啊"
      伊谢尔伦

      这个得看编码。如果编码标准不确定,恐怕什么软件都会读出乱码来。

        Ty80

        ...不确定和你说的是不是一个东西...
        无非是中文字符的问题,你直接取前6个字符的长度(不管中英文,6个字符总够了),转换成NSString,再直接substringToIndex:3一下,取前三个字,不就出来了吗?

          最新下载
          更多>
          网站特效
          网站源码
          网站素材
          前端模板
          关于我们 免责声明 Sitemap
          PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!