Rumah > pembangunan bahagian belakang > Golang > golang http dapatkan kod bercelaru

golang http dapatkan kod bercelaru

WBOY
Lepaskan: 2023-05-15 09:00:12
asal
1032 orang telah melayarinya

Dalam beberapa tahun kebelakangan ini, dengan populariti bahasa Go, semakin ramai orang mula menggunakan bahasa Go untuk membangunkan aplikasi web, termasuk program yang menggunakan HTTP untuk akses rangkaian. Walau bagaimanapun, menghadapi aksara bercelaru dalam permintaan HTTP GET adalah masalah biasa. Artikel ini akan meneroka masalah ini, kemungkinan puncanya, dan menyediakan beberapa penyelesaian.

1. Huraian Masalah

Apabila menulis permintaan HTTP GET dalam bahasa Go, kadangkala kita menghadapi masalah teks bercelaru. Gejala utama ialah badan tindak balas yang dikembalikan oleh permintaan mengandungi aksara yang bercelaru dan bukannya hasil yang dijangkakan.

2. Punca masalah

Mungkin terdapat banyak sebab untuk permintaan HTTP GET bercelaru Berikut adalah beberapa sebab biasa:

1 . Dalam pengepala respons permintaan HTTP, pelayan akan mengembalikan set aksara dokumen Jika kami tidak menghuraikan nilai ini dengan betul, ia boleh menyebabkan masalah pengekodan.

2. Tiada set aksara dinyatakan. Kadangkala pelayan tidak memberikan maklumat set aksara. Jika kami tidak menentukan set aksara, ia boleh menyebabkan masalah pengekodan.

3. Set aksara tidak sepadan. Kadangkala, set aksara dalam pengepala permintaan dan pengepala respons tidak sepadan, yang boleh mengakibatkan aksara bercelaru.

4. Apabila membaca data daripada fail, pengekodan yang dinyatakan tidak konsisten dengan pengekodan sebenar, yang juga boleh membawa kepada aksara yang bercelaru.

3. Penyelesaian

1. Semak set aksara respons pelayan

: Dalam HTTP GET, pengepala respons pelayan mengandungi maklumat set aksara. Jika kami tidak menyemak dan menghuraikan nilai ini dengan betul, ia boleh menyebabkan aksara bercelaru. Cara yang betul ialah menggunakan kaedah resp.Header.Get("Content-Type") yang disediakan dalam pustaka net/http bahasa Go untuk mendapatkan maklumat pengepala respons Jenis Kandungan dan mendapatkan nilai set aksara daripadanya. Kami kemudiannya perlu menggunakan charset ini untuk menukar badan tindak balas kepada rentetan yang betul. Contohnya, jika set aksara dalam pengepala respons ialah UTF-8, kita boleh menggunakan kaedah berikut untuk menukar badan tindak balas kepada rentetan berkod UTF-8.

import (
    "io/ioutil"
    "net/http"
)

func main() {
    resp, err := http.Get("http://example.com/")
    if err != nil {
        // handle error
    }
    defer resp.Body.Close()

    if resp.StatusCode != http.StatusOK {
        // handle error
    }

    contentType := resp.Header.Get("Content-Type")
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        // handle error
    }

    // convert body bytes to string
    var content string
    if strings.Contains(contentType, "UTF-8") {
        content = convertToString(string(body), "UTF-8", "UTF-8")
    } else {
        content = convertToString(string(body), contentType, "UTF-8")
    }
}

func convertToString(content string, srcEncoding string, destEncoding string) string {
    srcDecoder := charmap.Windows1252.NewDecoder()
    srcReader := strings.NewReader(content)
    srcReader.Reset(content)
    srcUTF8Reader := transform.NewReader(srcReader, srcDecoder)
    destDecoder := charmap.ISO8859_1.NewDecoder()
    destWriter := new(bytes.Buffer)
    destUTF8Writer := transform.NewWriter(destWriter, destDecoder)
    io.Copy(destUTF8Writer, srcUTF8Reader)
    return destWriter.String()
}
Salin selepas log masuk

2. Tentukan set aksara yang betul

Apabila menghantar permintaan HTTP GET, kami harus menentukan set aksara dalam pengepala permintaan. Dalam kes ini, kita perlu menggunakan kaedah Req.Header.Set("Content-Type", "text/html; charset=UTF-8") yang disediakan dalam pustaka net/http bahasa Go untuk menentukan Content-Type. Contohnya, jika kami ingin menghantar teks UTF-8 menggunakan pengekodan UTF-8, kami boleh menggunakan kod berikut:

import (
    "net/http"
)

func main() {
    client := http.Client{}
    req, err := http.NewRequest("GET", "http://example.com/", nil)
    if err != nil {
        // handle error
    }

    req.Header.Set("Content-Encoding", "gzip")
    req.Header.Set("Content-Type", "text/html; charset=UTF-8")

    resp, err := client.Do(req)
    if err != nil {
        // handle error
    }
    defer resp.Body.Close()
}
Salin selepas log masuk

3. Penukaran Set Aksara

Jika kami menentukan set aksara yang betul, tetapi masih Jika anda menemui aksara bercelaru, anda mungkin perlu melakukan penukaran set aksara pada kandungan yang dikembalikan. Kita boleh menggunakan kaedah transform.String() yang disediakan dalam perpustakaan golang.org/x/text/transform bahasa Go untuk menukar rentetan. Sebagai contoh, katakan kita membaca teks yang dikodkan ISO-8859-1 daripada fail, tetapi pelayan mengembalikan teks yang dikodkan UTF-8, kita boleh menggunakan kod berikut untuk menukar:

import (
    "bytes"
    "io"
    "io/ioutil"
    "net/http"
    "golang.org/x/text/transform"
    "golang.org/x/text/encoding/charmap"
)

func main() {
    resp, err := http.Get("http://example.com/")
    if err != nil {
        // handle error
    }
    defer resp.Body.Close()

    if resp.StatusCode != http.StatusOK {
        // handle error
    }

    // read body
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        // handle error
    }

    // convert body bytes to string
    s, _, err := transform.String(charmap.ISO8859_1.NewDecoder().Transformer(), string(body))
    if err != nil {
        // handle error
    }

    // do something with s
    ...
}
Salin selepas log masuk

4. Kesimpulan

Aksara bercelaru dalam permintaan HTTP GET mungkin menjejaskan keputusan permintaan rangkaian anda. Jika anda menghadapi masalah ini, mula-mula semak maklumat set aksara, dan kemudian semak set aksara dinyatakan dengan betul. Jika tiada satu pun daripada perkara di atas menyelesaikan masalah anda, anda mungkin perlu melakukan penukaran set aksara. Saya harap kaedah yang disediakan dalam artikel ini dapat membantu anda menyelesaikan masalah aksara bercelaru dalam permintaan HTTP GET.

Atas ialah kandungan terperinci golang http dapatkan kod bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan