Rumah > pangkalan data > tutorial mysql > Bagaimana untuk Menapis Aksara Unikod yang Tidak Disokong dalam MySQL?

Bagaimana untuk Menapis Aksara Unikod yang Tidak Disokong dalam MySQL?

Susan Sarandon
Lepaskan: 2024-10-30 12:52:03
asal
1081 orang telah melayarinya

How to Filter Unsupported Unicode Characters in MySQL?

Penapisan Aksara Unikod dalam MySQL

Pelaksanaan utf8 MySQL mempunyai had apabila ia tidak menyokong aksara 4-bait. Untuk mengatasi isu ini, pengguna mungkin perlu menapis aksara sedemikian sebelum menyimpan data dalam pangkalan data.

Satu pendekatan untuk menapis aksara unikod yang akan mengambil masa lebih daripada 3 bait dalam UTF-8 ialah menggunakan ungkapan biasa. Coretan Python berikut menunjukkan pendekatan ini:

<code class="python">import re

re_pattern = re.compile(u'[^\u0000-\uD7FF\uE000-\uFFFF]', re.UNICODE)

def filter_using_re(unicode_string):
    return re_pattern.sub(u'\uFFFD', unicode_string)

# Example usage:
unicode_string = "Hello, world! This is a unicode string with some 4-byte characters."
filtered_string = filter_using_re(unicode_string)</code>
Salin selepas log masuk

Dalam kod yang disediakan, re_pattern sepadan dengan aksara Unicode yang memerlukan lebih daripada 3 bait dalam UTF-8 dan subfungsi menggantikannya dengan CHARACTER PENGGANTIAN (uFFFD). ). Pengguna juga boleh menggantikannya dengan aksara gantian lain yang diingini seperti '?' jika lebih suka.

Dengan menggunakan pendekatan ini, pengguna boleh menapis aksara Unicode yang tidak disokong dengan berkesan sebelum ia disimpan dalam MySQL, memastikan keserasian dengan had pangkalan data.

Atas ialah kandungan terperinci Bagaimana untuk Menapis Aksara Unikod yang Tidak Disokong dalam MySQL?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan