84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
大家好,我遇到一个很棘手的问题想请教大家是怎么解决的。
pyspider遇到不规则的html页面时,只要其实包含不能正常解析的url时就会报错,如页面http://www.jb51.net/os/windows/win2008/18272.html,其中就有作者:增加 减小] 来源:互联网 时间:07-02 01:51:10 我要评论,这里页面的链接不能正常解析就会报Invalid IPv6 URL错误如下图:
作者:增加 减小] 来源:互联网 时间:07-02 01:51:10 我要评论
认证高级PHP讲师
如果你要深究,这是 lxml, pyquery, urlparse 标准库的 bug。
只能 catch 掉,然后手动建树。
如果你要深究,这是 lxml, pyquery, urlparse 标准库的 bug。
只能 catch 掉,然后手动建树。