Dalam beberapa tahun kebelakangan ini, dengan populariti bahasa Go, semakin ramai orang mula menggunakan bahasa Go untuk membangunkan aplikasi web, termasuk program yang menggunakan HTTP untuk akses rangkaian. Walau bagaimanapun, menghadapi aksara bercelaru dalam permintaan HTTP GET adalah masalah biasa. Artikel ini akan meneroka masalah ini, kemungkinan puncanya, dan menyediakan beberapa penyelesaian.
1. Huraian Masalah
Apabila menulis permintaan HTTP GET dalam bahasa Go, kadangkala kita menghadapi masalah teks bercelaru. Gejala utama ialah badan tindak balas yang dikembalikan oleh permintaan mengandungi aksara yang bercelaru dan bukannya hasil yang dijangkakan.
2. Punca masalah
Mungkin terdapat banyak sebab untuk permintaan HTTP GET bercelaru Berikut adalah beberapa sebab biasa:
1 . Dalam pengepala respons permintaan HTTP, pelayan akan mengembalikan set aksara dokumen Jika kami tidak menghuraikan nilai ini dengan betul, ia boleh menyebabkan masalah pengekodan.
2. Tiada set aksara dinyatakan. Kadangkala pelayan tidak memberikan maklumat set aksara. Jika kami tidak menentukan set aksara, ia boleh menyebabkan masalah pengekodan.
3. Set aksara tidak sepadan. Kadangkala, set aksara dalam pengepala permintaan dan pengepala respons tidak sepadan, yang boleh mengakibatkan aksara bercelaru.
4. Apabila membaca data daripada fail, pengekodan yang dinyatakan tidak konsisten dengan pengekodan sebenar, yang juga boleh membawa kepada aksara yang bercelaru.
3. Penyelesaian
1. Semak set aksara respons pelayan
: Dalam HTTP GET, pengepala respons pelayan mengandungi maklumat set aksara. Jika kami tidak menyemak dan menghuraikan nilai ini dengan betul, ia boleh menyebabkan aksara bercelaru. Cara yang betul ialah menggunakan kaedah resp.Header.Get("Content-Type") yang disediakan dalam pustaka net/http bahasa Go untuk mendapatkan maklumat pengepala respons Jenis Kandungan dan mendapatkan nilai set aksara daripadanya. Kami kemudiannya perlu menggunakan charset ini untuk menukar badan tindak balas kepada rentetan yang betul. Contohnya, jika set aksara dalam pengepala respons ialah UTF-8, kita boleh menggunakan kaedah berikut untuk menukar badan tindak balas kepada rentetan berkod UTF-8.
import ( "io/ioutil" "net/http" ) func main() { resp, err := http.Get("http://example.com/") if err != nil { // handle error } defer resp.Body.Close() if resp.StatusCode != http.StatusOK { // handle error } contentType := resp.Header.Get("Content-Type") body, err := ioutil.ReadAll(resp.Body) if err != nil { // handle error } // convert body bytes to string var content string if strings.Contains(contentType, "UTF-8") { content = convertToString(string(body), "UTF-8", "UTF-8") } else { content = convertToString(string(body), contentType, "UTF-8") } } func convertToString(content string, srcEncoding string, destEncoding string) string { srcDecoder := charmap.Windows1252.NewDecoder() srcReader := strings.NewReader(content) srcReader.Reset(content) srcUTF8Reader := transform.NewReader(srcReader, srcDecoder) destDecoder := charmap.ISO8859_1.NewDecoder() destWriter := new(bytes.Buffer) destUTF8Writer := transform.NewWriter(destWriter, destDecoder) io.Copy(destUTF8Writer, srcUTF8Reader) return destWriter.String() }
2. Tentukan set aksara yang betul
Apabila menghantar permintaan HTTP GET, kami harus menentukan set aksara dalam pengepala permintaan. Dalam kes ini, kita perlu menggunakan kaedah Req.Header.Set("Content-Type", "text/html; charset=UTF-8") yang disediakan dalam pustaka net/http bahasa Go untuk menentukan Content-Type. Contohnya, jika kami ingin menghantar teks UTF-8 menggunakan pengekodan UTF-8, kami boleh menggunakan kod berikut:
import ( "net/http" ) func main() { client := http.Client{} req, err := http.NewRequest("GET", "http://example.com/", nil) if err != nil { // handle error } req.Header.Set("Content-Encoding", "gzip") req.Header.Set("Content-Type", "text/html; charset=UTF-8") resp, err := client.Do(req) if err != nil { // handle error } defer resp.Body.Close() }
3. Penukaran Set Aksara
Jika kami menentukan set aksara yang betul, tetapi masih Jika anda menemui aksara bercelaru, anda mungkin perlu melakukan penukaran set aksara pada kandungan yang dikembalikan. Kita boleh menggunakan kaedah transform.String() yang disediakan dalam perpustakaan golang.org/x/text/transform bahasa Go untuk menukar rentetan. Sebagai contoh, katakan kita membaca teks yang dikodkan ISO-8859-1 daripada fail, tetapi pelayan mengembalikan teks yang dikodkan UTF-8, kita boleh menggunakan kod berikut untuk menukar:
import ( "bytes" "io" "io/ioutil" "net/http" "golang.org/x/text/transform" "golang.org/x/text/encoding/charmap" ) func main() { resp, err := http.Get("http://example.com/") if err != nil { // handle error } defer resp.Body.Close() if resp.StatusCode != http.StatusOK { // handle error } // read body body, err := ioutil.ReadAll(resp.Body) if err != nil { // handle error } // convert body bytes to string s, _, err := transform.String(charmap.ISO8859_1.NewDecoder().Transformer(), string(body)) if err != nil { // handle error } // do something with s ... }
4. Kesimpulan
Aksara bercelaru dalam permintaan HTTP GET mungkin menjejaskan keputusan permintaan rangkaian anda. Jika anda menghadapi masalah ini, mula-mula semak maklumat set aksara, dan kemudian semak set aksara dinyatakan dengan betul. Jika tiada satu pun daripada perkara di atas menyelesaikan masalah anda, anda mungkin perlu melakukan penukaran set aksara. Saya harap kaedah yang disediakan dalam artikel ini dapat membantu anda menyelesaikan masalah aksara bercelaru dalam permintaan HTTP GET.
Atas ialah kandungan terperinci golang http dapatkan kod bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!