Wie konvertiere ich Ersatzpaare in normale Zeichenfolgen in Python?-Python-Tutorial-php.cn

Wie konvertiere ich Ersatzpaare in normale Zeichenfolgen in Python?

Linda Hamilton

Freigeben： 2024-11-04 06:18:29

Original

935 Leute haben es durchsucht

How to Convert Surrogate Pairs to Normal Strings in Python?

Konvertieren von Ersatzpaaren in normale Zeichenfolgen in Python

Diese Frage sucht nach einer Methode, um eine Python-Unicode-Zeichenfolge, die Ersatzpaare enthält, in eine Standardzeichenfolge umzuwandeln Darstellung. Ziel ist es, ein verständliches Unicode-Zeichen oder ein standardisiertes Hexadezimalformat zu erhalten.

Das bereitgestellte Code-Snippet stellt einen Python-String dar, der ein Ersatzzeichenpaar enthält, das ein Emoji darstellt:

<code class="python">emoji = "This is \ud83d\ude4f, an emoji."</code>

Nach dem Login kopieren

Um das Problem aufzulösen Bei diesem Problem ist es wichtig, zwischen literalen Ersatzzeichenfolgen in einer JSON-Datei auf der Festplatte (sechs Zeichen) und Einzelzeichenfolgen zu unterscheiden Ersatzpaarzeichenfolgen im Speicher (ein Zeichen).

Wenn es sich bei der Zeichenfolge um ein einstelliges Ersatzzeichenpaar handelt, das im Python-Quellcode gefunden wird (wie im bereitgestellten Beispiel), weist dies auf einen potenziellen Upstream-Fehler hin. Wenn dies auftritt und nicht gelöst werden kann, kann der Surrogatepass-Fehlerhandler verwendet werden:

<code class="python">"\ud83d\ude4f".encode('utf-16', 'surrogatepass').decode('utf-16')</code>

Nach dem Login kopieren

Dadurch wird das entsprechende Unicode-Zeichen ausgegeben, dargestellt als Fragezeichen (?):

'?'

Nach dem Login kopieren

Im Fall von Literal-Ersatzpaarzeichenfolgen in einer JSON-Datei auf der Festplatte sollte das Ersatzpaar nach dem Laden des JSON nicht vorhanden sein Daten:

<code class="python">ascii(json.loads(r'"\ud83d\ude4f"'))</code>

Nach dem Login kopieren

Dadurch wird das standardisierte Hexadezimalformat für das Unicode-Zeichen ausgegeben:

'\U0001f64f'

Nach dem Login kopieren

Das Verständnis dieser Unterscheidung ist für den Umgang mit Ersatzzeichenpaaren in Python und deren Konvertierung in ein verwendbares Format von entscheidender Bedeutung .

Das obige ist der detaillierte Inhalt vonWie konvertiere ich Ersatzpaare in normale Zeichenfolgen in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!