Bagaimanakah Saya Boleh Memadankan Huruf Unicode dengan betul dalam PCRE PHP Menggunakan `\p{L}`?-tutorial php-php.cn

Bagaimanakah Saya Boleh Memadankan Huruf Unicode dengan betul dalam PCRE PHP Menggunakan `\p{L}`?

Linda Hamilton

Lepaskan： 2024-12-26 12:18:17

asal

213 orang telah melayarinya

How Can I Correctly Match Unicode Letters in PHP's PCRE Using `p{L}`?

Memadankan Aksara Huruf Unikod dalam PCRE/PHP: Meneroka Sifat Karakter Unikod

Pencarian untuk pengesah nama komprehensif dalam PHP telah membawa kepada penerokaan sifat aksara Unicode. Walau bagaimanapun, percubaan baru-baru ini dengan corak "/^([p{L}'- ]) $/" telah menghadapi had, gagal mengenali aksara seperti Ă atau 张.

Memahami Sifat Aksara Unikod

Corak menggunakan sifat aksara unicode p{L}, yang mewakili huruf dalam mana-mana bahasa. Walau bagaimanapun, sifat ini memerlukan mod UTF-8 untuk berfungsi dengan betul. Tanpa pengubah suai "u" dalam corak, sifat aksara unikod tidak digunakan, membawa kepada tingkah laku yang diperhatikan.

Menyelesaikan Isu

Untuk membetulkan masalah, pengubah suai "u" mesti ditambah pada corak. Ini membolehkan mod UTF-8, membenarkan sifat aksara unikod ditafsirkan dengan betul. Corak yang disemak semula "/^[-' p{L}] $/u" kini akan sepadan dengan huruf unikod, apostrof, sempang dan aksara ruang dengan tepat.

Pertimbangan Tambahan

Pastikan bahawa data input sememangnya dibekalkan dalam pengekodan UTF-8. Tentukan pengekodanUTF-8 secara eksplisit pada halaman borang untuk mengelakkan potensi isu keserasian. Selain itu, ambil perhatian bahawa corak masih membenarkan aksara ruang, yang mungkin perlu dihadkan dalam pengesah.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memadankan Huruf Unicode dengan betul dalam PCRE PHP Menggunakan `p{L}`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!