JavaScript에서 문자열의 악센트를 효율적으로 제거하는 방법은 무엇입니까?-JS 튜토리얼-php.cn

JavaScript에서 문자열의 악센트를 효율적으로 제거하는 방법은 무엇입니까?

Linda Hamilton

풀어 주다： 2024-12-14 22:38:15

원래의

222명이 탐색했습니다.

How to Efficiently Remove Accents from Strings in JavaScript?

JavaScript에서 문자열의 악센트/분음 부호 제거

문자열에서 악센트 문자를 제거하는 것은 텍스트 처리 및 데이터 분석에 유용한 작업이 될 수 있습니다. 제공된 코드에서 AccentsTidy 함수는 정규식을 사용하여 악센트를 제거하려고 시도합니다. 그러나 이 접근 방식은 특히 IE6과 같은 구형 브라우저에서는 효율적이거나 안정적이지 않을 수 있습니다.

ES2015/ES6 솔루션

더 현대적이고 효율적인 솔루션은 ES2015/ES6 String.prototype.normalize() 메서드. 이 메서드는 문자열을 유니코드 정규화된 형식으로 변환합니다. 결합된 문자소를 기본 문자와 결합 표시로 분해하는 "NFD" 형식을 사용하면 발음 구별 부호를 제거하는 것이 더 쉬워집니다. 예는 다음과 같습니다.

const str = "Crème Brûlée";
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "");
// "Creme Brulee"

로그인 후 복사

정규식은 다양한 발음 구별 부호를 포함하는 유니코드 범위 U 0300 → U 036F와 일치합니다. "NFKD"와 같은 다른 유니코드 정규 형식을 사용하여 uFB01(fi)과 같은 문자를 다르게 정규화할 수 있습니다.

유니코드 속성 이스케이프 사용

ES2018에서는 유니코드 속성 이스케이프를 도입했습니다. 보다 간결한 제거 방법 제공 발음 구별 부호:

str.normalize("NFD").replace(/\p{Diacritic}/gu, "");
// "Creme Brulee"

로그인 후 복사

이 이스케이프는 유니코드 속성 "Diacritic"이 있는 모든 문자와 일치합니다.

또는 정렬

목표가 다음과 같은 경우 악센트가 있는 문자열을 정렬하려면 Intl.Collator 개체를 사용할 수 있습니다. 발음 구별 부호를 무시하는 유니코드 표준 순서를 기반으로 문자열 정렬을 지원합니다. 예는 다음과 같습니다.

const c = new Intl.Collator();
["creme brulee", "crème brûlée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare);
// ['crame brulai', 'creme brulay', 'creme bruléa', 'creme brulee', 'crème brûlée', 'creme brulfé', 'crome brouillé']

로그인 후 복사

위 내용은 JavaScript에서 문자열의 악센트를 효율적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!