Beim Lesen einer UTF-8-codierten Datei mit einer BOM (Byte Order Mark) kann die BOM-Markierung unbeabsichtigt enthalten sein in der Ausgabezeichenfolge. Um dieses Problem zu beheben, führen Sie die folgenden Schritte aus:
FileReader fr = new FileReader(file); BufferedReader br = new BufferedReader(fr); String tmp = null; String content = ""; while ((tmp = br.readLine()) != null) { String text; if (tmp.startsWith("\uFEFF")) { // Skipping the BOM marker text = tmp.substring(1); } else { text = tmp; } content += text + System.getProperty("line.separator"); }
In diesem aktualisierten Code:
Indem wir die Stücklistenmarkierung entfernen, bevor wir sie an die Ausgabezeichenfolge anhängen, können wir verhindern, dass sie im Endergebnis erscheint.
Das obige ist der detaillierte Inhalt vonWie gehe ich mit Stücklistenmarkierungen in UTF-8-kodierten Dateien um?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!