Conversion de symboles et de lettres d'accentuation en alphabet anglais en Java
Énoncé du problème
Unicode englobe un vaste répertoire de caractères, dont beaucoup sont similaires aux lettres de l'alphabet anglais. Le défi réside dans la conversion de tous ces personnages similaires en leurs homologues anglais. Par exemple :
Les versions Unicode de lettres comme A/a posent une classification supplémentaire difficulté.
Solution Java
Pour relever ce défi de conversion, nous pouvons tirer parti de l'approche suivante en Java :
import java.text.Normalizer; import java.util.regex.Pattern; public String deAccent(String str) { String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+"); return pattern.matcher(nfdNormalizedString).replaceAll(""); }
Ce code normalise d'abord le chaîne utilisant NFD, puis utilise une expression régulière pour supprimer les signes diacritiques, ce qui entraîne la suppression des symboles d'accent et la conversion des caractères dans leur alphabet anglais équivalents.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!