> 백엔드 개발 > Golang > 골랑바이트란 무엇인가?

골랑바이트란 무엇인가?

(*-*)浩
풀어 주다: 2019-12-13 10:59:55
원래의
10774명이 탐색했습니다.

문자열의 각 요소를 "문자"라고 하며, 단일 문자열 요소를 순회하거나 얻을 때 문자를 얻을 수 있습니다.

골랑바이트란 무엇인가?

Go 언어에는 두 가지 유형의 문자가 있습니다.

하나는 uint8 유형, 즉 ASCII 코드의 문자를 나타내는 바이트 유형입니다. > > 다른 유형은 UTF-8 문자를 나타내는 룬 유형입니다. 중국어, 일본어 또는 기타 복합 문자를 처리해야 하는 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다. byte 유형은 uint8의 별칭입니다. 이는 var ch byte = 'A'와 같이 1바이트만 차지하는 기존 ASCII 인코딩 문자에 완전히 적합하며 문자는 작은따옴표로 묶입니다.

ASCII 코드 표에서 A의 값은 65이고 16진수 표기법에서는 41이므로 다음 쓰기는 동일합니다.

var ch byte = 65 或 var ch byte = '\x41'      //(\x 总是紧跟着长度为 2 的 16 进制数)
로그인 후 복사

또 다른 쓰기 방법은 An 8진수 길이를 따르는 것입니다. 377과 같이 3의 숫자입니다. Go 언어는 유니코드(UTF-8)도 지원하므로 문자는 유니코드 코드 포인트 또는 룬이라고도 하며 메모리에서는 int로 표시됩니다. 문서에서는 일반적으로 U+hhhh 형식이 사용됩니다. 여기서 h는 16진수를 나타냅니다.

유니코드 문자를 작성할 때는 16진수 앞에 접두사 u 또는 U를 추가해야 합니다. 유니코드는 최소 2바이트를 차지하므로 이를 표현하기 위해 int16 또는 int 유형을 사용합니다. 4바이트를 사용해야 하는 경우 u 접두사를 사용합니다. 8바이트를 사용해야 하는 경우 U 접두사를 사용합니다.

var ch int = '\u0041'
var ch2 int = '\u03B2'
var ch3 int = '\U00101234'
fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer
fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character
fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes
fmt.Printf("%U - %U - %U", ch, ch2, ch3)   // UTF-8 code point
로그인 후 복사

출력:

65 - 946 - 1053236
A - β - r
41 - 3B2 - 101234
U+0041 - U+03B2 - U+101234
로그인 후 복사
형식 지정자 %c는 문자를 나타내는 데 사용됩니다. %v 또는 %d는 문자를 나타내는 데 사용되는 정수를 출력합니다. U +hhhh 문자열.
유니코드 패키지에는 문자 테스트를 위한 몇 가지 내장 함수가 있습니다. 이러한 함수의 반환 값은 아래와 같이 부울 값입니다(여기서 ch는 문자를 나타냄).

위 내용은 골랑바이트란 무엇인가?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿