XMLDas Dokument kann Fremdzeichen wie Norwegisch oder Französisch enthalten (Chinesisch ist ebenfalls akzeptabel! Dieser Teil kann immer noch nicht gemäß dem Originaltext übersetzt werden. Ein Teil des folgenden Inhalts wurde von mir selbst geschrieben)
Damit Ihr Parser diese Zeichen versteht, müssen Sie im XML-Dokument einen konsistenten Zeichenkodierungsstandard übernehmen.
---------------- ------ ------------------------------------
Windows 95 /98 Notepad
Windows 95/98 Notepad kann keine Dateien im Unicode-Kodierungsformat speichern.
Sie können Notepad verwenden, um XML-Dokumente zu bearbeiten und zu speichern, die ausländische Zeichen enthalten (z. B. Norwegisch, Französisch oder Chinesisch).
<?xml version="1.0"?> <note> <from>小奀</from> <to>小林</to> <message>晚上一起去火锅呀</message> </note>
Wenn Sie dies jedoch mit einem Browser öffnen, verwenden Sie Notepad für Wenn Sie XML-Dokumente bearbeiten, wird ein Fehler angezeigt.
---------------- ------ ------------------------------------
unter Windows 95/98 Notepad Um die Kodierung
Windows 95/98 Notepad zum Bearbeiten von XML-Dateien zu verwenden, muss das Kodierungsattribut festgelegt werden.
Um Fehler zu vermeiden, können Sie der XML-Dokumentdeklaration ein Codierungsattribut hinzufügen, um den Codierungstyp dieses XML-Dokuments anzugeben, verwenden Sie jedoch keine Unicode-Codierung.
Der folgende Kodierungstyp verursacht keine Fehler und chinesische Schriftzeichen werden normal angezeigt:
<?xml version="1.0" encoding="gb2312"?>
Die folgenden Kodierungstypen verursachen keine Fehler und chinesische Schriftzeichen werden normal angezeigt:
<?xml version="1.0" encoding="gbk"?>
Die folgenden Kodierungstypen verursachen keine Fehler und chinesische Schriftzeichen werden abnormal angezeigt (verstümmelte Zeichen):
<?xml version="1.0" encoding="windows-1252"?>
Die folgenden Kodierungstypen verursachen keine Fehler Fehler verursachen und chinesische Schriftzeichen werden nicht normal angezeigt (verstümmelte Zeichen): Abnormale Anzeige (verstümmelte Zeichen):
<?xml version="1.0" encoding="ISO-8859-1"?>
Der folgende Codierungstyp verursacht keine Fehler und chinesische Schriftzeichen werden normal angezeigt :
<?xml version="1.0" encoding="UTF-8"?>
Der folgende Codierungstyp führt zu einem Fehler:
<?xml version="1.0" encoding="UTF-16"?>
--------------- --------------------------------------------------- -------------------
Windows 2000 Notepad verwenden
Windows 2000 Notepad kann Dateien im Unicode-Kodierungsformat speichern.
Notepad für Windows 2000 unterstützt UnicodeZeichensatz. Wenn Sie Win2000 Notepad verwenden, um das XML-Dokument im Unicode-Kodierungsformat zu speichern (bitte beachten Sie, dass die XML-Deklaration keine Kodierungsinformationen enthält):
<?xml version="1.0"?> <note><from>小奀</from><to>小林</to><message>晚上一起去火锅呀</message></note>
------------ - ------------------------------------------------- - -----------------
Windows 2000 Notepad-Kodierung
Windows 2000 Notepad kann Dateien auch im „UTF-16“-Kodierungsformat speichern.
Wenn Sie das Codierungsattribut im XML-Dokument deklarieren und die Datei im Unicode-Codierungsformat speichern, kann ein Fehler auftreten.
Der folgende Code verursacht einen Fehler:
<?xml version="1.0" encoding="windows-1252"?>
Der folgende Code verursacht einen Fehler:
<?xml version="1.0" encoding="ISO-8859-1"?>
Der folgende Code verursacht einen Fehler :
<?xml version="1.0" encoding="UTF-8"?>
Die folgende Datei: note_encode_utf16_u.xml wird in IE5.0+ normal angezeigt, verursacht jedoch einen Fehler im Netscape 6.2-Browser.
<?xml version="1.0" encoding="UTF-16"?>
---------------------------------------------------- --- ---------------------------
Fehlermeldung
Wenn Sie IE5.0 oder höher zum Durchsuchen von XML-Dokumenten verwenden, können zwei verschiedene Codierungsfehler auftreten:
Im Text wurde ein ungültiges Zeichen gefunden Inhalt (Im Textinhalt wurde ein ungültiges Zeichen gefunden).
Wenn Ihr XML-Dokument nicht mit dem Kodierungsformat Ihres XML-Dokuments übereinstimmt, kann ein Fehler auftreten. Normalerweise enthält das XML-Dokument einige „nicht-englische“ Zeichen und verwendet eine Einzelbyte-Kodierung Editor, und das Kodierungsformat des XML-Dokuments wird nicht in der Deklaration des XML-Dokuments festgelegt.
Wechselnvon der aktuellen Kodierung zur angegebenen Kodierungfallsdiese Kodierung nicht unterstützt wird.
Wenn das XML-Dokument im Unicode/UTF-16-Codierungsformat gespeichert ist, die Deklaration des XML-Dokuments das Codierungsformat jedoch auf eine Einzelbyte-Codierung festlegt (z. B. Windows-1252, ISO-8859- 1 oder UTF-8); oder das XML-Dokument wird in einem Einzelbyte-Kodierungsformat gespeichert, aber die Deklaration des XML-Dokuments legt das Kodierungsformat auf eine Unicode/UTF-16-Kodierungsform fest. Beide Situationen führen zu Fehlern. ---------------- ------ ------------------------------------FazitFazit: Speichern Bevor Sie das Kodierungsformat des Dokuments in der Deklaration des XML-Dokuments festlegen, einige meiner Vorschläge zur Fehlervermeidung:
Stellen Sie sicher, dass Sie wissen, welche Kodierung Sie verwenden.
Verwenden Sie Attributdeklarationen in XML-Dokumenten, um das Codierungsformat festzulegen.
Das obige ist der detaillierte Inhalt vonDetaillierte Einführung zum Bearbeiten von XML-Dateien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!