Python输入中文的问题

Question

我写了一个爬乌云漏洞库的爬虫，其URL形式为http://www.wooyun.org/corps/公司名称/page/1，程序最后raw_input处输入公司名称即可跑出该公司的漏洞。现在的问题是中文编码的问题没解决好，如果公司的名称是英文如...

伊谢尔伦 · Answer

L'URL contient des caractères chinois et doit être échappée..
Remplacez la ligne 14 par

url = 'http://www.wooyun.org/corps/' + urllib.quote(corpName)+ '/page/' + str(pageNum)

Le terminal Ubuntu Gnome a été testé avec succès (Baidu)

阿神 · Answer

Je ne pense pas que ce soit un problème d'encodage des caractères. Comment les caractères chinois peuvent-ils apparaître directement dans URL ? Ne pensez pas que lorsque le navigateur affiche : http://www.wooyun.org/corps/公司名称/page/1, vous pensez que le URL dans le 公司名称 demandé par le navigateur est en réalité un caractère chinois.

En fait, lorsque le navigateur fait une requête, tous les caractères chinois de URL seront convertis avec URLEncode, et il n'y a aucun caractère chinois dans la vraie requête.

Comme vous l'avez demandé : http://www.wooyun.org/corps/阿里巴巴/page/1 , cela n'aboutira pas.
Mais si vous écrivez l'URL sous la forme : http://www.wooyun.org/corps/阿里巴巴/page/1, vous pouvez demander avec succès la page Alibaba.

巴扎黑 · Answer

from urllib import quote

print quote('百度')