在 Go 中,標準函式庫假定所有文字檔案都採用 UTF-8 編碼。但是,對於以其他字元集編碼的檔案來說,情況可能並非如此。本文介紹如何使用 golang.org/x/text/encoding 套件在 Go 中讀取非 UTF-8 文字檔。
golang.org/x/text/encoding 套件提供了通用的介面可以與 UTF-8 相互轉換的字元編碼。例如,golang.org/x/text/encoding/simplifiedchinese 子包提供了 GB18030、GBK 和 HZ-GB2312 的編碼器。
範例:讀取GBK 編碼檔案
package main import ( "bufio" "fmt" "log" "os" "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func main() { const filename = "example_GBK_file" // Read UTF-8 from a GBK encoded file f, err := os.Open(filename) if err != nil { log.Fatal(err) } r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder()) // Read converted UTF-8 from `r` as needed sc := bufio.NewScanner(r) for sc.Scan() { fmt.Printf("Read line: %s\n", sc.Bytes()) } if err := sc.Err(); err != nil { log.Fatal(err) } if err = f.Close(); err != nil { log.Fatal(err) } }
這個範例使用了一個transform.NewReader來包裝一個os.File 物件並執行從GBK 到UTF- 8 的即時解碼。
附加說明:
以上是如何在Go中讀取非UTF-8編碼的文字檔?的詳細內容。更多資訊請關注PHP中文網其他相關文章!