Comment gérer les caractères UTF-8 non valides dans une chaîne dans Go
Lors du rassemblement d'une liste de chaînes à l'aide de json.Marshal, vous pouvez rencontrez le message d'erreur "json : UTF-8 invalide dans la chaîne". Cela se produit en raison de séquences UTF-8 non valides dans les chaînes.
Remplacement ou suppression de caractères non valides
En Python, vous disposez de méthodes pour supprimer, remplacer ou augmenter exceptions pour les caractères UTF-8 non valides. Go propose une solution similaire :
Utilisation de strings.ToValidUTF8 (Go 1.13)
Cette fonction supprime les séquences UTF-8 non valides d'une chaîne et les remplace par le remplacement Unicode caractère (U FFFD).
fixedString := strings.ToValidUTF8("a\xc5z", "")
Mappage et remplacement par utf8.RuneError (Go 1.11)
Vous pouvez également mapper des caractères dans une chaîne à l'aide de strings.Map et utf8.RuneError. Si le caractère est une erreur Unicode (invalide), il est remplacé par la valeur de secours spécifiée (par exemple, -1).
fixUtf := func(r rune) rune { if r == utf8.RuneError { return -1 } return r } var input1 = "a\xc5z" fmt.Println(strings.Map(fixUtf, input1)) // Output: az var input2 = "posic�o" fmt.Println(strings.Map(fixUtf, input2)) // Output: posico
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!