> 백엔드 개발 > Golang > Go에서 잘못된 UTF-8 문자를 어떻게 제거할 수 있나요?

Go에서 잘못된 UTF-8 문자를 어떻게 제거할 수 있나요?

Patricia Arquette
풀어 주다: 2024-12-14 16:10:17
원래의
195명이 탐색했습니다.

How Can I Remove Invalid UTF-8 Characters in Go?

Go에서 잘못된 UTF-8 문자 제거

JSON 데이터로 작업할 때 잘못된 UTF-8 문자가 발견되어 마샬링 중에 오류가 발생할 수 있습니다. 이 문제는 UTF-8 인코딩을 따르지 않는 바이트가 있기 때문에 발생합니다.

잘못된 UTF-8 문자 처리

Go에서는 또는 다양한 접근 방식을 사용하여 유효하지 않은 문자 바꾸기:

Go 1.13

strings.ToValidUTF8("a\xc5z", "")
로그인 후 복사

Go 1.11

fixUtf := func(r rune) rune {
    if r == utf8.RuneError {
        return -1
    }
    return r
}

fmt.Println(strings.Map(fixUtf, "a\xc5z"))
fmt.Println(strings.Map(fixUtf, "posic�o"))
로그인 후 복사

이 함수는 잘못된 UTF-8 문자를 음수 값으로 매핑하여 제거하고 결과는 다음과 같습니다.

az
posico
로그인 후 복사

위 내용은 Go에서 잘못된 UTF-8 문자를 어떻게 제거할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿