>백엔드 개발 >Golang >Go 언어에 문자 유형이 있나요?

Go 언어에 문자 유형이 있나요?

青灯夜游
青灯夜游원래의
2021-06-04 17:08:242101검색

Go 언어에는 두 가지 문자 유형이 있습니다. 1. ASCII 코드의 문자를 나타내는 uint8 유형이라고도 하는 바이트 유형, 2. UTF-8 문자를 나타내는 룬 유형. , 일본어 또는 기타 복합 문자의 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다.

Go 언어에 문자 유형이 있나요?

이 튜토리얼의 운영 환경: Windows 10 시스템, GO 1.11.2, Dell G3 컴퓨터.

문자열의 각 요소를 "문자"라고 하며, 문자열 요소를 순회하거나 개별적으로 얻을 때 문자를 얻을 수 있습니다.

Go 언어에는 두 가지 문자 유형이 있습니다.

  • 하나는 uint8 유형, 즉 ASCII 코드의 문자를 나타내는 바이트 유형입니다.

  • 다른 하나는 UTF-8 문자를 나타내는 룬 유형입니다. 중국어, 일본어 또는 기타 복합 문자를 처리해야 하는 경우 룬 유형을 사용해야 합니다. rune 유형은 int32 유형과 동일합니다.

byte 유형은 uint8의 별칭입니다. 이는 var ch byte = 'A'와 같이 1바이트만 차지하는 기존 ASCII 인코딩 문자에 완전히 적합하며 문자는 작은따옴표로 묶입니다.

ASCII 코드 표에서 A의 값은 65이고 16진수 표기법에서는 41이므로 다음 쓰기는 동일합니다.

var ch byte = 65 或 var ch byte = '\x41'      //(\x 总是紧跟着长度为 2 的 16 进制数)

또 다른 가능한 쓰기 방법은 3개의 8진수 길이를 따르는 것입니다. 377 등.

Go 언어는 유니코드(UTF-8)도 지원하므로 문자는 유니코드 코드 포인트 또는 룬이라고도 하며 메모리에서는 int로 표시됩니다. 문서에서는 일반적으로 U+hhhh 형식이 사용됩니다. 여기서 h는 16진수를 나타냅니다.

유니코드 문자를 작성할 때는 16진수 앞에 접두사 u 또는 U를 추가해야 합니다. 유니코드는 최소 2바이트를 차지하므로 이를 표현하기 위해 int16 또는 int 유형을 사용합니다. 4바이트를 사용해야 하는 경우 u 접두사를 사용합니다. 8바이트를 사용해야 하는 경우 U 접두사를 사용합니다.

var ch int = '\u0041'
var ch2 int = '\u03B2'
var ch3 int = '\U00101234'
fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer
fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character
fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes
fmt.Printf("%U - %U - %U", ch, ch2, ch3)   // UTF-8 code point

출력:

65 - 946 - 1053236
A - β - r
41 - 3B2 - 101234
U+0041 - U+03B2 - U+101234

형식 지정자 %c는 문자를 나타내는 데 사용됩니다. 문자와 함께 사용하면 %v 또는 %d는 문자를 나타내는 데 사용되는 정수를 출력합니다. 끈.

유니코드 패키지에는 문자 테스트를 위한 몇 가지 내장 함수가 있습니다. 이러한 함수의 반환 값은 아래와 같이 부울 값입니다(여기서 ch는 문자를 나타냄).

  • 문자인지 확인합니다: 유니코드. IsLetter(ch )

  • 숫자인지 판단: unicode.IsDigit(ch)

  • 빈 기호인지 판단: unicode.IsSpace(ch)

추천 학습: Golang 튜토리얼

위 내용은 Go 언어에 문자 유형이 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.