JavaScript에서 문자열의 악센트/분음 부호 제거
문자열에서 악센트 문자를 제거하는 것은 텍스트 처리 및 데이터 분석에 유용한 작업이 될 수 있습니다. 제공된 코드에서 AccentsTidy 함수는 정규식을 사용하여 악센트를 제거하려고 시도합니다. 그러나 이 접근 방식은 특히 IE6과 같은 구형 브라우저에서는 효율적이거나 안정적이지 않을 수 있습니다.
ES2015/ES6 솔루션
더 현대적이고 효율적인 솔루션은 ES2015/ES6 String.prototype.normalize() 메서드. 이 메서드는 문자열을 유니코드 정규화된 형식으로 변환합니다. 결합된 문자소를 기본 문자와 결합 표시로 분해하는 "NFD" 형식을 사용하면 발음 구별 부호를 제거하는 것이 더 쉬워집니다. 예는 다음과 같습니다.
const str = "Crème Brûlée"; str.normalize("NFD").replace(/[\u0300-\u036f]/g, ""); // "Creme Brulee"
정규식은 다양한 발음 구별 부호를 포함하는 유니코드 범위 U 0300 → U 036F와 일치합니다. "NFKD"와 같은 다른 유니코드 정규 형식을 사용하여 uFB01(fi)과 같은 문자를 다르게 정규화할 수 있습니다.
유니코드 속성 이스케이프 사용
ES2018에서는 유니코드 속성 이스케이프를 도입했습니다. 보다 간결한 제거 방법 제공 발음 구별 부호:
str.normalize("NFD").replace(/\p{Diacritic}/gu, ""); // "Creme Brulee"
이 이스케이프는 유니코드 속성 "Diacritic"이 있는 모든 문자와 일치합니다.
또는 정렬
목표가 다음과 같은 경우 악센트가 있는 문자열을 정렬하려면 Intl.Collator 개체를 사용할 수 있습니다. 발음 구별 부호를 무시하는 유니코드 표준 순서를 기반으로 문자열 정렬을 지원합니다. 예는 다음과 같습니다.
const c = new Intl.Collator(); ["creme brulee", "crème brûlée", "crame brulai", "crome brouillé", "creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare); // ['crame brulai', 'creme brulay', 'creme bruléa', 'creme brulee', 'crème brûlée', 'creme brulfé', 'crome brouillé']
위 내용은 JavaScript에서 문자열의 악센트를 효율적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!