Gelegentlich werden Sie Zeichen wie „ in den Daten sehen, wenn der Browser sie durch Codes identifiziert. Lassen Sie uns mit Ihnen über HTML-Escape-Zeichen sprechen Sie können verstehen, dass
gelegentlich Zeichen wie ' in den Daten zu sehen sind. Die Merkmale sind wie folgt:
beginnt mit , ist eine Zahlenfolge in der Mitte. und endet mit;
Es beginnt mit &, einer Zeichenfolge in der Mitte, und endet mit; > Wenn der Browser auf diese Escape-Zeichen stößt, wird er zurückgesetzt, aber wie kann man ihn anhand des Codes identifizieren? org.apache.commons.lang.StringEscapeUtils.unescapeHtml bietet eine gute Erklärung
Wenn Sie auf die erste Situation oben stoßen, ist die Mitte eine Zahl, konvertieren Sie die Zahl (Unicode) direkt in char
Im zweiten Fall , es gibt Zeichen in der Mitte. Suchen Sie die dem Zeichen entsprechende Zahl aus der Zuordnungstabelle und konvertieren Sie sie auf einen Blick, wenn Sie sich den Code ansehen 🎜>Sehen Sie sich an, wie HTML40 es definiert
Der Code lautet wie folgt:
Sehen Sie sich an, was BASIC_ARRAY, ISO8859_1_ARRAY bzw. HTML40_ARRAY sind
BASIC_ARRAY
static { HTML40 = new Entities(); fillWithHtml40Entities(HTML40); } static void fillWithHtml40Entities(Entities entities) { entities.addEntities(BASIC_ARRAY); entities.addEntities(ISO8859_1_ARRAY); entities.addEntities(HTML40_ARRAY); }
Der Code lautet wie folgt:
ISO8859_1_ARRAY
private static final String[][] BASIC_ARRAY = {{"quot", "34"}, // " - double-quote {"amp", "38"}, // & - ampersand {"lt", "60"}, // < - less-than {"gt", "62"}, // > - greater-than };
HTML40_ARRAY
Das obige ist der detaillierte Inhalt vonSo identifizieren Sie HTML-Escape-Zeichen durch Code. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!