C 11 문자열 리터럴은 유니코드 인코딩을 어떻게 처리합니까?-C++-php.cn

C 11 문자열 리터럴은 유니코드 인코딩을 어떻게 처리합니까?

Mary-Kate Olsen

풀어 주다： 2024-12-17 13:56:15

원래의

799명이 탐색했습니다.

How Do C 11 String Literals Handle Unicode Encoding?

C 11 문자열 리터럴의 유니코드 인코딩

C 11에서는 유니코드 인코딩을 용이하게 하기 위해 새로운 문자 유형과 문자열 리터럴을 도입했습니다. 이 문서에서는 다음 질문에 답하면서 이러한 새로운 기능의 사용법과 의미를 살펴봅니다.

문자 참조 및 문자열 유형

"x/ u/U" 문자 참조는 모든 문자열과 결합 가능 유형?

답변: 아니요. "x"는 모든 문자열에 사용할 수 있지만 "u"와 "U"는 UTF로 인코딩된 문자열로 제한됩니다.

고정 너비 문자열

문자열 유형은 고정 너비입니까, 아니면 "x/u/U" 참조가 바이트 수를 확장합니까?

답변: 문자열의 코드 단위 수는 인코딩에 따라 다르지만 배열의 요소 수는 그대로 유지됩니다. 수정되었습니다.

"u"" 및 "u8"" 문자열에 대한 UTF 인코딩 의미

"u "" 및 "u8"" 문자열에는 인코딩 의미가 있으므로 BMP가 아닌 코드의 인코딩이 가능합니다. 포인트?

답변: 예, "u""는 UTF-16 인코딩 문자열을 생성하고 "u8""은 UTF-8 인코딩 문자열을 생성합니다. BMP가 아닌 코드 포인트는 이에 따라 인코딩됩니다.

"u"와 함께 Lone Surrogate 사용