Comment puis-je réparer les caractères UTF-8 cassés lors de l'utilisation de file_get

Comment puis-je réparer les caractères UTF-8 cassés lors de l'utilisation de file_get_contents() ?

Susan Sarandon

Libérer： 2024-11-30 07:20:11

original

890 Les gens l'ont consulté

How Can I Fix Broken UTF-8 Characters When Using file_get_contents()?

Correction des caractères UTF-8 brisés avec file_get_contents()

Lors de la récupération de contenu HTML à partir de sources externes à l'aide de file_get_contents(), il est courant de rencontrer problèmes avec la rupture des caractères UTF-8. Cela peut entraîner l'affichage de caractères absurdes à la place des caractères multilingues prévus.

Solution : conversion d'encodage avec mb_convert_encoding()

Une solution efficace consiste à utiliser mb_convert_encoding( ) pour convertir explicitement le contenu HTML récupéré en codage UTF-8. La ligne de code suivante présente cette approche :

$html = mb_convert_encoding(file_get_contents('http://example.com'), 'UTF-8', 'auto');

Copier après la connexion

En utilisant le paramètre "auto" dans la fonction mb_detect_encoding(), l'encodage correct des caractères du contenu HTML peut être automatiquement détecté. Cela garantit que le contenu récupéré est correctement converti en UTF-8, résolvant ainsi le problème de brouillage des caractères.

Considérations supplémentaires :

Assurez-vous que le serveur hébergeant le Le fichier HTML a le codage correct configuré.
Définissez l'en-tête Content-Type dans la réponse HTTP pour indiquer le codage UTF-8 du Document HTML.
Utilisez la fonction "utf8_encode()" pour convertir le HTML récupéré en UTF-8.
Utilisez la fonction "iconv()" pour convertir le HTML récupéré en UTF-8.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!