我使用的Python版本为3.5.2
,尝试用zipfile
模块的zipfile.ZipFile.open
方法打开一个压缩包中的文本文件时,即使使用了文档中要求的rU
参数,打开时仍然是以二进制数据格式打开的,百思不得其解。
代码:
>>> import zipfile
>>> zf = zipfile.ZipFile('/Users/chiqingjun/Downloads/top-1m.csv.zip')
>>> zf.namelist()
['top-1m.csv']
>>> f = zf.open(zf.namelist()[0], mode='rU')
>>> f
<zipfile.ZipExtFile name='top-1m.csv' mode='rU' compress_type=deflate>
>>> f.readline()
b'1,google.com\n'
# 仍然是二进制数据
官方文档(3.5.2版本):
其实最后输出的二进制, 和
zipfile
无关, 是和py3.5
有关, 你可以在输出的结果解码, 就能得到字符类型了文档已经说了呀,
rU
是通用换行符
,并且将在3.6 移除此模式。压缩文件以二进制读取字节内容是应该的,后面如何转码由程序员决定。