84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
认证高级PHP讲师
html 漏了u?另外看下你整个文件保存的字符集,不然即使你加了u,如果文件是GBK的那么也可能遇到一些意外的问题。
字符集不同,如@DDTDDT 所说,你的html缺了unicode的标记u,但是正则表达式却用了unicode
你的微信号后面的冒号,一个是半角,一个是全角
可以使用Beautiful Soup
你正则表达式是 unicode 编码的,你的 html 是字符串类型的,在 python2 中中文字符一般设置成的是utf-8编码,你用 unicode 字符串的正则去获取 utf-8 编码的字符串当然就匹配失败了。
建议将 html 用 unicode 编码。
也就是拿到 utf-8 编码的html后 ,content = html.decode('utf-8')
content = html.decode('utf-8')
再用正则匹配 content
html 漏了u?
另外看下你整个文件保存的字符集,不然即使你加了u,如果文件是GBK的那么也可能遇到一些意外的问题。
字符集不同,如@DDTDDT 所说,你的html缺了unicode的标记u,但是正则表达式却用了unicode
你的微信号后面的冒号,一个是半角,一个是全角
可以使用Beautiful Soup
你正则表达式是 unicode 编码的,你的 html 是字符串类型的,在 python2 中中文字符一般设置成的是utf-8编码,你用 unicode 字符串的正则去获取 utf-8 编码的字符串当然就匹配失败了。
建议将 html 用 unicode 编码。
也就是拿到 utf-8 编码的html后 ,
content = html.decode('utf-8')
再用正则匹配 content