Correction des caractères UTF-8 brisés avec file_get_contents()
Lors de la récupération de contenu HTML à partir de sources externes à l'aide de file_get_contents(), il est courant de rencontrer problèmes avec la rupture des caractères UTF-8. Cela peut entraîner l'affichage de caractères absurdes à la place des caractères multilingues prévus.
Solution : conversion d'encodage avec mb_convert_encoding()
Une solution efficace consiste à utiliser mb_convert_encoding( ) pour convertir explicitement le contenu HTML récupéré en codage UTF-8. La ligne de code suivante présente cette approche :
$html = mb_convert_encoding(file_get_contents('http://example.com'), 'UTF-8', 'auto');
En utilisant le paramètre "auto" dans la fonction mb_detect_encoding(), l'encodage correct des caractères du contenu HTML peut être automatiquement détecté. Cela garantit que le contenu récupéré est correctement converti en UTF-8, résolvant ainsi le problème de brouillage des caractères.
Considérations supplémentaires :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!