Go에서 BOM(바이트 순서 표시)이 있는 파일 읽기
Go에서 바이트 순서가 있거나 없는 유니코드 파일 처리 마크(BOM)는 수동 처리가 필요합니다. 핵심 라이브러리 내에 확립된 방법은 없지만 일반적인 접근 방식은 다음과 같습니다.
버퍼 리더 사용:
Java.io.BufferedReader를 활용하여 다음을 수행할 수 있습니다. 처음 몇 바이트를 포함하여 파일에서 데이터를 읽습니다. 예는 다음과 같습니다.
import ( "bufio" "os" "log" ) func main() { fd, err := os.Open("filename") if err != nil { log.Fatal(err) } defer fd.Close() br := bufio.NewReader(fd) r, _, err := br.ReadRune() if err != nil { log.Fatal(err) } if r != '\uFEFF' { br.UnreadRune() } }
첫 번째 바이트 직접 읽기:
io.Seeker 인터페이스가 지원되면 처음 3바이트를 읽고 확인할 수 있습니다. BOM이 식별되지 않으면 파일 포인터가 시작 부분으로 재설정될 수 있습니다.
import ( "os" "log" ) func main() { fd, err := os.Open("filename") if err != nil { log.Fatal(err) } defer fd.Close() var bom [3]byte _, err = fd.Read(bom[:]) if err != nil { log.Fatal(err) } if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf { _, err = fd.Seek(0, 0) if err != nil { log.Fatal(err) } } }
참고:
이러한 접근 방식에서는 UTF-8 인코딩을 가정합니다. 다양한 인코딩을 처리하면 복잡성이 더해집니다.
위 내용은 Go에서 BOM(바이트 순서 표시)이 있는 파일을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!