Rumah > pembangunan bahagian belakang > tutorial php > Bagaimana untuk Mengeluarkan Aksara Tidak Boleh Cetak dengan Berkesan daripada Rentetan dalam Pengekodan Aksara Berbeza?

Bagaimana untuk Mengeluarkan Aksara Tidak Boleh Cetak dengan Berkesan daripada Rentetan dalam Pengekodan Aksara Berbeza?

Linda Hamilton
Lepaskan: 2024-12-10 19:32:11
asal
513 orang telah melayarinya

How to Effectively Remove Non-Printable Characters from Strings in Different Character Encodings?

Cara Mengalih Keluar Aksara Tidak Boleh Cetak daripada Rentetan

Apabila bekerja dengan data teks, selalunya perlu mengalih keluar aksara yang tidak boleh dicetak untuk memastikan konsistensi dan kebolehbacaan. Ini termasuk aksara kawalan (0-31) dan aksara ASCII lanjutan (127 dan ke atas).

7-Bit ASCII

Untuk rentetan ASCII 7-bit, anda boleh gunakan ungkapan biasa berikut untuk mengalih keluar aksara yang tidak boleh dicetak:

$string = preg_replace('/[\x00-\x1F\x7F-\xFF]/', '', $string);
Salin selepas log masuk

8-Bit ASCII lanjutan

Untuk mengekalkan aksara dalam julat 128-255, laraskan regex kepada:

$string = preg_replace('/[\x00-\x1F\x7F]/', '', $string);
Salin selepas log masuk

UTF-8

Untuk rentetan UTF-8, gunakan pengubah suai /u untuk menampung Unicode aksara:

$string = preg_replace('/[\x00-\x1F\x7F\xA0]/u', '', $string);
Salin selepas log masuk

Alternatif: str_replace

Walaupun preg_replace secara amnya cekap, anda juga boleh menggunakan str_replace seperti berikut:

// Create an array of non-printable characters
$badchars = array(
    // Control characters
    chr(0), chr(1), chr(2), chr(3), chr(4), chr(5), chr(6), chr(7), chr(8),
    chr(9), chr(10), chr(11), chr(12), chr(13), chr(14), chr(15), chr(16),
    chr(17), chr(18), chr(19), chr(20), chr(21), chr(22), chr(23), chr(24),
    chr(25), chr(26), chr(27), chr(28), chr(29), chr(30), chr(31),
    // Non-printable characters
    chr(127)
);

// Replace the bad characters
$str2 = str_replace($badchars, '', $str);
Salin selepas log masuk

Prestasi Pertimbangan

Sama ada preg_replace atau str_replace lebih cepat bergantung pada panjang rentetan. Untuk rentetan pendek, preg_replace biasanya lebih pantas, manakala str_replace mungkin lebih cekap untuk rentetan yang lebih panjang. Penandaarasan disyorkan untuk menentukan pendekatan terbaik.

Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Aksara Tidak Boleh Cetak dengan Berkesan daripada Rentetan dalam Pengekodan Aksara Berbeza?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan