Rumah > pembangunan bahagian belakang > masalah PHP > Bagaimana untuk menyelesaikan masalah kacau Cina php mbsubstr

Bagaimana untuk menyelesaikan masalah kacau Cina php mbsubstr

藏色散人
Lepaskan: 2023-03-12 09:10:01
asal
2296 orang telah melayarinya

Penyelesaian kepada aksara bercelaru bahasa Cina dalam php mbsubstr: 1. Gunakan mb_substr() pustaka sambungan mbstring untuk memintas; 2. Selesaikan masalah aksara bercelaru melalui "function sub_str(){...}" kaedah.

Bagaimana untuk menyelesaikan masalah kacau Cina php mbsubstr

Persekitaran pengendalian artikel ini: sistem Windows 7, versi PHP7.1, komputer Dell G3

Cara menyelesaikan Masalah php mbsubstr bahasa Cina?

PHP menggunakan substr untuk memintas rentetan dan masalah dengan aksara Cina yang kacau berlaku Gunakan mb_substr

Contoh: mb_substr('Pemintasan aksara Cina yang kacau. ',0,5, 'utf-8');

语法 : string substr (string string, int start [, int length])
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
Salin selepas log masuk

Jika permulaan ialah nombor negatif, rentetan yang dikembalikan akan bermula dari aksara permulaan pada penghujung rentetan.

$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
Salin selepas log masuk

Jika panjang parameter diberikan dan merupakan nombor positif, rentetan yang dikembalikan akan menjadi aksara panjang dari mula.

Jika panjang parameter diberikan dan merupakan nombor negatif, rentetan yang dikembalikan akan berakhir pada aksara ke-panjang dari hujung rentetan.

$rest = substr ("abcdef", 1, -1); // returns "bcde"
Salin selepas log masuk

Tiada masalah dengan bahasa Inggeris Kami menguji bahasa Cina

$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
Salin selepas log masuk

Hasil daripada memintas aksara bukanlah hasil yang kami mahukan muncul situasi boleh menyebabkan program gagal berjalan dengan betul.

Terdapat dua penyelesaian utama:

1 Gunakan mb_substr() pustaka sambungan mbstring untuk memintas, supaya aksara yang bercelaru tidak akan muncul.

Anda boleh menggunakan fungsi mb_substr()/mb_strcut(). Penggunaan mb_substr()/mb_strcut() adalah serupa dengan substr(), kecuali satu lagi parameter perlu ditambah pada penghujung mb_substr ()/mb_strcut untuk menetapkan pengekodan String,

Tetapi kebanyakan pelayan tidak membuka php_mbstring.dll Anda perlu membuka php_mbstring.dll dalam php.ini.

echo mb_substr("php中文字符encode",0,4,"utf-8");
Salin selepas log masuk

Jika parameter pengekodan terakhir tidak dinyatakan, tiga bait akan menjadi satu aksara Cina Ini adalah ciri pengekodan utf-8 Jika huraian set aksara utf-8 ditambahkan, jadi, ia ialah Ia dipintas dalam unit satu perkataan.

Apabila menggunakannya, perhatikan pengekodan fail php dan pengekodan apabila memaparkan halaman web. Untuk menggunakan kaedah mb_substr ini, anda perlu mengetahui pengekodan rentetan terlebih dahulu Jika anda tidak mengetahui pengekodan, anda perlu menilai Pustaka mbstring juga menyediakan mb_check_encoding untuk menyemak pengekodan rentetan, tetapi ia masih belum sempurna .

PHP datang dengan beberapa fungsi pemintasan rentetan, antaranya substr dan mb_substr biasa digunakan. Apabila yang pertama memproses bahasa Cina, GBK ialah 2 unit panjang dan UTF ialah 3 unit panjang Selepas yang kedua menentukan pengekodan, satu aksara Cina ialah 1 unit panjang.

substr kadangkala memotong 1/3 bahasa Cina atau separuh bahasa Cina dan memaparkan aksara yang bercelaru, mb_substr lebih sesuai untuk kita gunakan. Tetapi kadangkala mb_substr nampaknya tidak begitu berguna. Sebagai contoh, jika saya ingin memaparkan maklumat ringkas gambar kecil, 5 aksara Cina adalah betul Jika terdapat lebih daripada 5 aksara, hanya memintas 4 yang pertama dan tambah "..." Ini tiada masalah semasa memproses Bahasa Cina, tetapi apabila memproses bahasa Inggeris atau nombor, pemintasan ini akan menjadi terlalu pendek.

Disyorkan: "Tutorial Video PHP"

Kedua, tulis sendiri fungsi pemintasan, tetapi kecekapannya tidak setinggi menggunakan perpustakaan sambungan mbstring. Berikut ialah fungsi dalam ecshop yang memintas rentetan yang dikodkan dalam UTF-8.

function sub_str($str, $length = , $append = true)
{
  $str = trim($str);
  $strlength = strlen($str);
  if ($length == || $length >= $strlength)
  {
    return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身
  }
  elseif ($length < ) //如果截取长度为负数
  {
    $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
    if ($length < )
    {
      $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
    }
  }
  if (function_exists(&#39;mb_substr&#39;))
  {
    $newstr = mb_substr($str, , $length, EC_CHARSET);
  }
  elseif (function_exists(&#39;iconv_substr&#39;))
  {
    $newstr = iconv_substr($str, , $length, EC_CHARSET);
  }
  else
  {
    //$newstr = trim_right(substr($str, , $length));
    $newstr = substr($str, , $length);
  }
  if ($append && $str != $newstr)
  {
    $newstr .= &#39;...&#39;;
  }
  return $newstr;
}
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk menyelesaikan masalah kacau Cina php mbsubstr. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
php
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan