首页 >社区问答列表 >python - 使用`zipfile`模块在不解压缩的情况下如何使用text模式读取文本文件?

python - 使用`zipfile`模块在不解压缩的情况下如何使用text模式读取文本文件?

我使用的Python版本为3.5.2,尝试用zipfile模块的zipfile.ZipFile.open方法打开一个压缩包中的文本文件时,即使使用了文档中要求的rU参数,打开时仍然是以二进制数据格式打开的,百思不得其解。

代码:

>>> import zipfile
>>> zf = zipfile.ZipFile('/Users/chiqingjun/Downloads/top-1m.csv.zip')
>>> zf.namelist()
['top-1m.csv']
>>> f = zf.open(zf.namelist()[0], mode='rU')
>>> f
<zipfile.ZipExtFile name='top-1m.csv' mode='rU' compress_type=deflate>
>>> f.readline()
b'1,google.com\n'
# 仍然是二进制数据

官方文档(3.5.2版本):

  • 巴扎黑
  • 巴扎黑    2017-06-22 11:53:422楼

    其实最后输出的二进制, 和zipfile无关, 是和py3.5有关, 你可以在输出的结果解码, 就能得到字符类型了

    content = f.readline()
    print(content.decode('utf8'))

    +0添加回复

  • 回复
  • 女神的闺蜜爱上我
  • 女神的闺蜜爱上我    2017-06-22 11:53:421楼

    文档已经说了呀,rU通用换行符,并且将在3.6 移除此模式。

    压缩文件以二进制读取字节内容是应该的,后面如何转码由程序员决定。

    +0添加回复

  • 回复