Go 언어에는 두 가지 문자 유형이 있습니다. 1. ASCII 코드의 문자를 나타내는 uint8 유형이라고도 하는 바이트 유형, 2. UTF-8 문자를 나타내는 룬 유형. , 일본어 또는 기타 복합 문자의 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다.
이 튜토리얼의 운영 환경: Windows 10 시스템, GO 1.11.2, Dell G3 컴퓨터.
문자열의 각 요소를 "문자"라고 하며, 문자열 요소를 순회하거나 개별적으로 얻을 때 문자를 얻을 수 있습니다.
Go 언어에는 두 가지 문자 유형이 있습니다.
하나는 uint8 유형, 즉 ASCII 코드의 문자를 나타내는 바이트 유형입니다.
다른 하나는 UTF-8 문자를 나타내는 룬 유형입니다. 중국어, 일본어 또는 기타 복합 문자를 처리해야 하는 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다.
byte 유형은 uint8의 별칭입니다. 이는 var ch byte = 'A'와 같이 1바이트만 차지하는 기존 ASCII 인코딩 문자에 완전히 적합하며 문자는 작은따옴표로 묶입니다.
ASCII 코드 표에서 A의 값은 65이고 16진수 표기법에서는 41이므로 다음 쓰기는 동일합니다.
var ch byte = 65 或 var ch byte = '\x41' //(\x 总是紧跟着长度为 2 的 16 进制数)
또 다른 가능한 쓰기 방법은 3개의 8진수 길이를 따르는 것입니다. 377
등.
Go 언어는 유니코드(UTF-8)도 지원하므로 문자는 유니코드 코드 포인트 또는 룬이라고도 하며 메모리에서는 int로 표시됩니다. 문서에서는 일반적으로 U+hhhh 형식이 사용됩니다. 여기서 h는 16진수를 나타냅니다.
유니코드 문자를 작성할 때는 16진수 앞에 접두사 u 또는 U를 추가해야 합니다. 유니코드는 최소 2바이트를 차지하므로 이를 표현하기 위해 int16 또는 int 유형을 사용합니다. 4바이트를 사용해야 하는 경우 u 접두사를 사용합니다. 8바이트를 사용해야 하는 경우 U 접두사를 사용합니다.
var ch int = '\u0041' var ch2 int = '\u03B2' var ch3 int = '\U00101234' fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes fmt.Printf("%U - %U - %U", ch, ch2, ch3) // UTF-8 code point
출력:
65 - 946 - 1053236 A - β - r 41 - 3B2 - 101234 U+0041 - U+03B2 - U+101234
형식 지정자 %c는 문자를 나타내는 데 사용됩니다. 문자와 함께 사용하면 %v 또는 %d는 문자를 나타내는 데 사용되는 정수를 출력합니다. 끈.
유니코드 패키지에는 문자 테스트를 위한 몇 가지 내장 함수가 있습니다. 이러한 함수의 반환 값은 아래와 같이 부울 값입니다(여기서 ch는 문자를 나타냄).
문자인지 확인합니다: 유니코드. IsLetter(ch )
숫자인지 판단: unicode.IsDigit(ch)
빈 기호인지 판단: unicode.IsSpace(ch)
추천 학습: Golang 튜토리얼
위 내용은 Go 언어에 문자 유형이 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!