mysqlまたはphpで「u00e9」をutf8文字に変換するにはどうすればよいですか?
P粉704196697
P粉704196697 2023-08-24 20:34:18
0
2
556

mysql にインポートしている乱雑なデータのデータ クリーニングを行っています。

データには、「u00e9」など、実際に文字列に埋め込まれている「疑似」Unicode 文字が含まれています。

フィールドは次のようになります。「Jalostotitlu00e1n」 この厄介な「u00e1n」を削除し、対応する utf 文字

に置き換える必要があります。

おそらく部分文字列と CHR を使用して、mysql でこれを行うこともできますが、PHP 経由でデータを前処理しているので、そこでも行うことができます。

utf データを使用するように mysql と php を設定する方法はすでに知っています。実際、問題はインポートしたソース データにあります。

ありがとうございます

P粉704196697
P粉704196697

全員に返信 (2)
P粉743288436

/* utf8 htmlをansiに変換するphp関数 */

リーリー
いいねを押す+0
    P粉198814372

    ###やり方がある。すべての

    uXXXXを HTML 表現に置き換え、html_entity_decode()を実行します。

    つまり

    echo html_entity_decode("Jalostotitlán");形式

    u1234のすべての UTF 文字は、HTML ではとして出力できます。ただし、UTF シーケンスの先頭を識別する文字が他にない場合、誤検知が大量に発生する可能性があるため、置換を行うことは非常に困難です。単純な正規表現はのようになります。

    preg_replace('/u([\da-fA-F]{4})/', '\1;', $str)

    いいねを押す+0
      最新のダウンロード
      詳細>
      ウェブエフェクト
      公式サイト
      サイト素材
      フロントエンドテンプレート
      私たちについて 免責事項 Sitemap
      PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!