Memadankan Aksara Huruf Unikod dalam PCRE/PHP: Meneroka Sifat Karakter Unikod
Pencarian untuk pengesah nama komprehensif dalam PHP telah membawa kepada penerokaan sifat aksara Unicode. Walau bagaimanapun, percubaan baru-baru ini dengan corak "/^([p{L}'- ]) $/" telah menghadapi had, gagal mengenali aksara seperti Ă atau 张.
Memahami Sifat Aksara Unikod
Corak menggunakan sifat aksara unicode p{L}, yang mewakili huruf dalam mana-mana bahasa. Walau bagaimanapun, sifat ini memerlukan mod UTF-8 untuk berfungsi dengan betul. Tanpa pengubah suai "u" dalam corak, sifat aksara unikod tidak digunakan, membawa kepada tingkah laku yang diperhatikan.
Menyelesaikan Isu
Untuk membetulkan masalah, pengubah suai "u" mesti ditambah pada corak. Ini membolehkan mod UTF-8, membenarkan sifat aksara unikod ditafsirkan dengan betul. Corak yang disemak semula "/^[-' p{L}] $/u" kini akan sepadan dengan huruf unikod, apostrof, sempang dan aksara ruang dengan tepat.
Pertimbangan Tambahan
Pastikan bahawa data input sememangnya dibekalkan dalam pengekodan UTF-8. Tentukan pengekodanUTF-8 secara eksplisit pada halaman borang untuk mengelakkan potensi isu keserasian. Selain itu, ambil perhatian bahawa corak masih membenarkan aksara ruang, yang mungkin perlu dihadkan dalam pengesah.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memadankan Huruf Unicode dengan betul dalam PCRE PHP Menggunakan `p{L}`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!