Python lxml の中国語解析に関する問題
高洛峰
高洛峰 2017-05-18 10:44:31
0
2
594

lxml を使用して漢字をキャプチャすると、結果は非常に苦痛になります。対処方法がわかりません...

リーリー

結果は次のようにキャプチャされます [u'\xe6\x80\xa7\xe8\xb4\xa8']
unicode ですが、内容は str エンコードです。これを中国語に変換するにはどうすればよいですか?
通常、 '\xe6\x80\xa7\xe8\xb4\xa8' または u'\u6027\u8d28'

にする必要があります
高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全員に返信(2)
淡淡烟草味

リーリー

いいねを押す +0
滿天的星座

これが発生する場合、通常はリクエストが Web ページの間違ったエンコーディングを推測したことが原因です
そのため、リクエストのエンコーディングを指定するだけです。
res.encoding ='utf-8'

リーリー
いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート