Comment convertir « u00e9 » en caractères utf8 dans MySQL ou php ?
P粉704196697
P粉704196697 2023-08-24 20:34:18
0
2
557

Je nettoie des données sur certaines données désordonnées que j'importe dans MySQL.

Les données contiennent des "pseudo" caractères Unicode qui sont réellement intégrés dans la chaîne, tels que "u00e9", etc.

Un champ pourrait donc être.."Jalostotitlu00e1n" Je dois extraire ce "u00e1n" maladroit et le remplacer par le caractère utf correspondant

Je pourrais le faire dans MySQL, peut-être en utilisant des sous-chaînes et CHR, mais je prétraite les données via PHP, donc je peux également le faire là-bas.

Je sais déjà comment configurer MySQL et PHP pour utiliser les données UTF. Le problème réside en fait dans les données sources que j'ai importées.

Merci

P粉704196697
P粉704196697

répondre à tous (2)
P粉743288436

/* fonction php pour convertir utf8 html en ansi */

public static function Utf8_ansi($valor='') { $utf8_ansi2 = array( "\u00c0" =>"À", "\u00c1" =>"Á", "\u00c2" =>"Â", "\u00c3" =>"Ã", "\u00c4" =>"Ä", "\u00c5" =>"Å", "\u00c6" =>"Æ", "\u00c7" =>"Ç", "\u00c8" =>"È", "\u00c9" =>"É", "\u00ca" =>"Ê", "\u00cb" =>"Ë", "\u00cc" =>"Ì", "\u00cd" =>"Í", "\u00ce" =>"Î", "\u00cf" =>"Ï", "\u00d1" =>"Ñ", "\u00d2" =>"Ò", "\u00d3" =>"Ó", "\u00d4" =>"Ô", "\u00d5" =>"Õ", "\u00d6" =>"Ö", "\u00d8" =>"Ø", "\u00d9" =>"Ù", "\u00da" =>"Ú", "\u00db" =>"Û", "\u00dc" =>"Ü", "\u00dd" =>"Ý", "\u00df" =>"ß", "\u00e0" =>"à", "\u00e1" =>"á", "\u00e2" =>"â", "\u00e3" =>"ã", "\u00e4" =>"ä", "\u00e5" =>"å", "\u00e6" =>"æ", "\u00e7" =>"ç", "\u00e8" =>"è", "\u00e9" =>"é", "\u00ea" =>"ê", "\u00eb" =>"ë", "\u00ec" =>"ì", "\u00ed" =>"í", "\u00ee" =>"î", "\u00ef" =>"ï", "\u00f0" =>"ð", "\u00f1" =>"ñ", "\u00f2" =>"ò", "\u00f3" =>"ó", "\u00f4" =>"ô", "\u00f5" =>"õ", "\u00f6" =>"ö", "\u00f8" =>"ø", "\u00f9" =>"ù", "\u00fa" =>"ú", "\u00fb" =>"û", "\u00fc" =>"ü", "\u00fd" =>"ý", "\u00ff" =>"ÿ"); return strtr($valor, $utf8_ansi2); }
    P粉198814372

    Il existe un moyen. Mettez toutuXXXX替换为其 HTML 表示形式,并执行html_entity_decode()

    C'estecho html_entity_decode("Jalostotitlán");

    u1234形式的每个 UTF 字符都可以在 HTML 中打印为. Mais faire le remplacement est très difficile car s’il n’y a pas d’autres caractères pour identifier le début de la séquence UTF, vous pouvez obtenir beaucoup de faux positifs. Une simple expression régulière pourrait être

    preg_replace('/u([da-fA-F]{4})/', '', $str)

      Derniers téléchargements
      Plus>
      effets Web
      Code source du site Web
      Matériel du site Web
      Modèle frontal
      À propos de nous Clause de non-responsabilité Sitemap
      Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!