Python输入中文的问题

Question

我写了一个爬乌云漏洞库的爬虫，其URL形式为http://www.wooyun.org/corps/公司名称/page/1，程序最后raw_input处输入公司名称即可跑出该公司的漏洞。现在的问题是中文编码的问题没解决好，如果公司的名称是英文如...

伊谢尔伦 · Answer

URL mengandungi aksara Cina dan perlu dilepaskan..
Gantikan baris 14 dengan

url = 'http://www.wooyun.org/corps/' + urllib.quote(corpName)+ '/page/' + str(pageNum)

Terminal Ubuntu Gnome telah berjaya diuji (Baidu)

阿神 · Answer

Saya rasa ini bukan masalah pengekodan aksara Bagaimanakah aksara Cina boleh muncul secara langsung dalam URL? Jangan fikir apabila penyemak imbas memaparkan: http://www.wooyun.org/corps/公司名称/page/1, anda fikir URL dalam 公司名称 yang diminta oleh penyemak imbas adalah benar-benar aksara Cina.

Malah, apabila penyemak imbas membuat permintaan, semua aksara Cina dalam URL akan ditukar dengan URLEncode dan tiada aksara Cina dalam permintaan sebenar.

Seperti yang anda minta: http://www.wooyun.org/corps/阿里巴巴/page/1 , ini tidak akan berjaya.
Tetapi jika anda menulis URL sebagai: http://www.wooyun.org/corps/阿里巴巴/page/1, anda boleh berjaya meminta halaman Alibaba.

巴扎黑 · Answer

from urllib import quote

print quote('百度')