JSON-Codierung und Unicode-Zeichenanzeige
Beim Codieren von Zeichenfolgen, die „spezielle“ Unicode-Zeichen mit der json_encode-Funktion von PHP enthalten, werden diese oft hexadezimal verstümmelt angezeigt codierte Zeichenfolgen. Zum Beispiel:
json_encode(['foo' => '馬']); // {"foo":"\u99ac"}
Grundlegendes zur JSON-String-Kodierung
In JSON können String-Literale als Unicode-Codepunkte dargestellt werden, die mit einem Backslash („u“) maskiert sind. Dies ermöglicht die Kodierung jedes beliebigen Zeichens, unabhängig von seiner Kodierung im ursprünglichen Zeichensatz. Somit ist die obige JSON-Zeichenfolge vollkommen gültig und stellt das gleiche Zeichen dar wie ihr uncodiertes Gegenstück („馬“).
PHPs Standardcodierungseinstellung
PHPs json_encode-Funktion priorisiert die Verwendung von „u“-Escape-Sequenzen zur Codierung von Nicht-ASCII-Zeichen. Dies entspricht dem JSON-Standard und gewährleistet die Portabilität von JSON-Daten. Bei Bedarf kann man diese Einstellung deaktivieren, indem man das JSON_UNESCAPED_UNICODE-Flag angibt:
json_encode(['foo' => '馬'], JSON_UNESCAPED_UNICODE); // {"foo":"馬"}
Unicode-Darstellung in JSON
Es ist wichtig zu beachten, dass sowohl maskierte als auch nicht codierte Unicode-Zeichen verwendet werden haben in JSON die gleiche Bedeutung und den gleichen Wert. Die Wahl der Kodierung hängt von den spezifischen Anforderungen der Datenstruktur ab. Aus Gründen der Interoperabilität und Kompatibilität mit verschiedenen Plattformen und Anwendungen wird jedoch im Allgemeinen die maskierte Form bevorzugt.
Das obige ist der detaillierte Inhalt vonWie geht PHPs „json_encode' mit Unicode-Zeichen um und wie kann ich die Ausgabe steuern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!