python - UnicodeDecodeError: 'gb2312'
伊谢尔伦
伊谢尔伦 2017-04-17 17:35:54
0
4
310

用requests爬取一个网页,用BeautifulSoup解析
但是在print的时候一直打印乱码
然后我decode("gb2312"),因为那个网页的charset=gb2312,但是就提示:
UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 2-3: illegal multibyte sequence
但是我用gbk的话
就会通过,但是打印出一些『脦垄脨脜脜脷脫脩碌脛脟茅脠陇脌露脡芦脨隆碌脳驴茫』的文字。

新手求解!!

伊谢尔伦
伊谢尔伦

小伙看你根骨奇佳,潜力无限,来学PHP伐。

répondre à tous(4)
大家讲道理

打印乱码的原因很多,首先是打印的载体,也就是你的终端,比如,win下的控制台,与linux下的终端支持的编码就不一样, 可能一个显示,一个不显示,还有就是一些IDE自带的终端,比如pycharm 都有可配置的编码 所以说打印出乱码,原因很多,最好你完善一下具体的信息。

伊谢尔伦

试一下decode("gb2312", errors="ignore")

伊谢尔伦

requests不是都会转成unicode编码吗 仔细看下文档

Ty80

预计你那段文字是utf8的

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!