Das Beispiel in diesem Artikel beschreibt die Konvertierungsmethode für den Python-Codierungstyp. Teilen Sie es als Referenz mit allen. Die Details lauten wie folgt:
1: Python und Unicode
Um mehrsprachige Texte korrekt zu verarbeiten, Python wurde nach Version 2.0 als Unicode-Zeichenfolge eingeführt.
2: Drucken in Python
Obwohl Python intern die Textkodierung zur Verarbeitung in Unicode-Kodierung konvertieren muss, wird die Terminalanzeige durch herkömmliche Python-Strings erledigt (In Tatsächlich kann die print-Anweisung von Python überhaupt keine Doppelbyte-Unicode-codierten Zeichen ausdrucken.
Pythons Druck führt automatisch eine Kodierungskonvertierung für die ausgegebene Unicode-Kodierung durch (bei anderen Nicht-Unicode-Kodierungen gibt print sie so aus, wie sie ist) (bei der Ausgabe an die Konsole), die Schreibmethode des Dateiobjekts jedoch Wenn einige Zeichenfolgen normal durch Drucken ausgegeben werden, ist das Schreiben in die Datei daher möglicherweise nicht unbedingt dasselbe wie das Drucken.
Unter Linux wird es entsprechend den Umgebungsvariablen konvertiert. Sie können es anzeigen, indem Sie den Befehl locale unter Linux verwenden. Die Implementierung der Druckanweisung besteht darin, den auszugebenden Inhalt an das Betriebssystem zu übertragen, und das Betriebssystem kodiert den Eingabebytestrom entsprechend der Kodierung des Systems.
>>>str='学习python' >>> str '\xe5\xad\xa6\xe4\xb9\xa0python' #asII编码 >>> print str 学习python >>> str=u'学习python' >>> str ####unicode编码 '\xe5u\xad\xa6\xe4\xb9\xa0python'
3: in Python dekodieren
Andere Zeichensätze in Unicode-Kodierung konvertieren (nur chinesische Schriftzeichen erforderlich). (zu konvertieren)
>>> str='学习' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60'
Auf diese Weise werden die chinesischen Zeichen codiert und konvertiert, und Python kann für die anschließende Verarbeitung verwendet werden (falls nicht konvertiert). , Python Die standardmäßige Kodierungskonvertierung wird basierend auf den Umgebungsvariablen des Computers durchgeführt, sodass möglicherweise verstümmelte Zeichen angezeigt werden)
4: in Python kodieren
Unicode in andere Zeichen konvertieren Sets
>>> str='学习' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60' >>> ustr.encode('utf-8') '\xe5\xad\xa6\xe4\xb9\xa0' >>> print ustr.encode('utf-8') 学习
Weitere Artikel zur Konvertierung des Python-Codierungstyps finden Sie auf der chinesischen PHP-Website!