クロールしたときに得られた内容はこんな感じでした b{"title":"u5173u6ce8","card_type_name":"u5173u6ce8"} エンコードを漢字に変換する方法を教えてください
まず方法を見つけましたfollow_text = follow.text.encode('utf-8').decode('unicode-escape'),
最初の応答は次のように変換できますが、follow.text 変換の結果は 'utf-8' コーデックになります。位置 2809 ~ 2810 の文字をエンコードできません。
次に、それを text[:2809] に変更してみます。エラーは報告されませんが、text[2811:]## に変更すると、依然としてエラーが発生します。 #Use print(follow.text[2800:2810] )出力は '_image_url' です。変換が失敗した理由がわかりません
何が問題なのか、それとも他に変換する方法はあるのかお聞きしたいのですが得たコンテンツ
なら
follow.text
本身是 str(unicode) 的话,encode('utf8') 回去没有任何意义,直接decode('unicode-escape')
それでいいですもし
follow.text
是 bytes 的话,那就可以选择先 decode('utf8') ,再decode('unicode-escape')
(質問の正しいエンコーディングがutf8であると仮定します)
json を使用して直接デコードできます