Konvertieren von Symbolen und Akzentbuchstaben in das englische Alphabet in Java
Problemstellung
Unicode umfasst ein umfangreiches Repertoire an Zeichen, von denen viele den Buchstaben des englischen Alphabets ähneln. Die Herausforderung besteht darin, all diese ähnlichen Zeichen in ihre englischen Gegenstücke umzuwandeln. Zum Beispiel:
Unicode-Versionen von Buchstaben wie A/a stellen eine weitere Klassifizierung dar Schwierigkeit.
Java-Lösung
Um diese Konvertierungsherausforderung anzugehen, können wir den folgenden Ansatz in Java nutzen:
import java.text.Normalizer; import java.util.regex.Pattern; public String deAccent(String str) { String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+"); return pattern.matcher(nfdNormalizedString).replaceAll(""); }
Dieser Code normalisiert zunächst die String mithilfe von NFD und verwendet dann einen regulären Ausdruck, um die diakritischen Zeichen zu entfernen, was zur Entfernung von Akzentsymbolen und zur Konvertierung der Zeichen in ihr englisches Alphabet führt Äquivalente.
Das obige ist der detaillierte Inhalt vonWie konvertiert man Unicode-Symbole und Akzentbuchstaben in Java in das englische Alphabet?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!