84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
我的str="【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网",使用re.split('【|】|-')分割该字符串,结果不是想象中的(红豆杉、红豆杉作用与功效、红豆杉抗癌药品、健客网四部分),而是出现乱码,请问对于中文字符的分割,应该采用什么办法?
欢迎选择我的课程,让我们一起见证您的进步~~
# -*- coding: UTF-8 -*- import re str=u"【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网" re.split(u'【|】|-|_', str) for i in re.split(u'【|】|-|_', str): print i
你该去了解一下unicode
乱码是什么?如果你是Py2.x版本的话,直接print list或者dict是会显示乱码,而print list[1]这样打印就不会。这是Python print对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。建议贴代码 贴结果。
使用 unicode
你该去了解一下unicode
乱码是什么?如果你是Py2.x版本的话,直接print list或者dict是会显示乱码,而print list[1]这样打印就不会。
这是Python print对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。
建议贴代码 贴结果。
使用 unicode