Memadankan Aksara Bukan ASCII dengan Ungkapan Biasa dalam JavaScript/jQuery
Aksara bukan ASCII sering memberikan cabaran apabila bekerja dengan teks dalam JavaScript /jQuery. Untuk memadankan perkataan secara individu dalam rentetan input, tanpa mengira bahasa, adalah penting untuk mengendalikan aksara seperti ü, ö, ß dan ñ yang terletak di luar set aksara ASCII.
Salah satu penyelesaian yang paling mudah ialah menggunakan ungkapan biasa berikut:
[^\x00-\x7F]+
Corak ini sepadan dengan mana-mana aksara yang bukan dalam set aksara ASCII (0-127, iaitu, 0x0 hingga 0x7F). Ia secara berkesan memilih aksara dengan nilai Unikod lebih daripada 127.
Sebagai alternatif, untuk pemadanan Unikod, anda boleh menggunakan:
[^\u0000-\u007F]+
Corak ini mengecualikan semua aksara dalam julat Unikod 0x0000 hingga 0x007F, membenarkan untuk padanan yang lebih luas.
Untuk memahami julat Unicode dengan lebih baik, anda boleh meneroka sumber berikut:
Dengan memasukkan ungkapan biasa ini ke dalam JavaScript anda / kod jQuery, anda boleh mengenal pasti dan memproses aksara bukan ASCII dengan cekap dalam rentetan input anda, tanpa mengira bahasa atau aksara pengekodan.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memadankan Aksara Bukan ASCII dalam JavaScript/jQuery Menggunakan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!