Comment convertir du texte à partir d'encodages arbitraires (par exemple, Windows-1256) en UTF-8 dans Go ?-Golang-php.cn

Comment convertir du texte à partir d'encodages arbitraires (par exemple, Windows-1256) en UTF-8 dans Go ?

Mary-Kate Olsen

Libérer： 2024-11-29 21:54:11

original

918 Les gens l'ont consulté

How to Convert Text from Arbitrary Encodings (e.g., Windows-1256) to UTF-8 in Go?

Conversion d'encodage en Go : des encodages arbitraires à UTF-8

Lorsque vous travaillez avec du texte, il est essentiel de pouvoir convertir entre différents encodages. Go fournit un support pour cela via son package d'encodage. Une tâche de conversion courante consiste à transformer les données d'un ancien codage vers le format UTF-8 largement utilisé.

Conversion Windows-1256 vers UTF-8

Envisagez un scénario dans lequel le texte stocké dans le codage arabe Windows-1256 doit être converti en UTF-8. Pour y parvenir dans Go, suivez ces étapes :

Importez les packages nécessaires :
- encodage pour la fonctionnalité d'encodage de base
- golang. org/x/text/encoding/charmap spécifiquement pour Windows-1256 (remarque : ce package n'est pas disponible sur Go Playground)
Initialiser un encodeur en utilisant l'encodage souhaité :
```
decoder := charmap.Windows1256.NewDecoder()
```
Copier après la connexion
Créer un lecteur qui lira à partir du texte saisi dans l'encodage d'origine :
```
reader := strings.NewReader(inputString)
```
Copier après la connexion
Créer un écrivain qui écrira dans le tampon de destination en UTF-8 :
```
writer := transform.NewWriter(outputStream, utf8.UTF8.NewEncoder())
```
Copier après la connexion
Copiez les octets du lecteur vers l'écrivain, permettant à l'encodeur d'effectuer la conversion :
```
io.Copy(writer, reader)
```
Copier après la connexion
Fermez l'enregistreur pour vider tous les octets restants et finaliser le conversion :
```
writer.Close()
```
Copier après la connexion