Solution au problème des caractères chinois tronqués lorsque PHP intercepte des chaînes

黄舟
Libérer: 2023-03-17 14:20:02
original
2920 Les gens l'ont consulté

Dans l'article précédent, nous vous avons présenté l'implémentation de l'interception des chaînes en PHP et l'utilisation de PHP pour intercepter les chaînes chinoises. Ensuite, lorsque nous interceptons les chaînes chinoises, de nombreux problèmes surviendront. caractères, alors aujourd'hui nous allons vous présenter comment résoudre le problème des caractères tronqués chinois lors de l'interception de chaînes en PHP !

PHP utilise substr pour intercepter les chaînes et le problème du chinois tronqué se produit. Utilisez mb_substr
Exemple :

mb_substr('截取中文乱码问题测试',0,5, 'utf-8');
Copier après la connexion

Syntaxe :

string substr (string string, int start [, int length])
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
Copier après la connexion

Si start est un. nombre négatif, renvoyez-le. La chaîne commencera par le caractère de début à la fin de la chaîne.

$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
Copier après la connexion

Si le paramètre length est donné et est un nombre positif, la chaîne renvoyée sera de longueur en caractères depuis le début.

Si le paramètre length est donné et est un nombre négatif, la chaîne renvoyée se terminera au ième caractère de la longueur à partir de la fin de la chaîne.

$rest = substr ("abcdef", 1, -1); // returns "bcde"
Copier après la connexion

Il n'y a aucun problème avec l'anglais. Nous avons testé un chinois

$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
Copier après la connexion

Le résultat de l'interception de caractères n'est certainement pas le résultat que nous souhaitons. Si les caractères chinois de PHP substr sont tronqués, le programme risque de ne pas fonctionner correctement.
Il existe deux solutions principales :

Tout d'abord, utilisez mb_substr() de la bibliothèque d'extension mbstring pour intercepter, afin que les caractères tronqués n'apparaissent pas.
Vous pouvez utiliser la fonction mb_substr()/mb_strcut(). L'utilisation de mb_substr()/mb_strcut() est similaire à substr(), sauf qu'un paramètre supplémentaire doit être ajouté à la fin de mb_substr. ()/mb_strcut pour définir l'encodage de chaîne,
mais la plupart des serveurs n'ouvrent pas php_mbstring.dll Vous devez ouvrir php_mbstring.dll dans php.ini.

echo mb_substr("php中文字符encode",0,4,"utf-8");
Copier après la connexion

Si le dernier paramètre d'encodage n'est pas spécifié, trois octets seront un caractère chinois. C'est la caractéristique de l'encodage utf-8 si le jeu de caractères utf-8 est. ajouté L'explication est donc interceptée en unités d'un mot.
Lors de son utilisation, faites attention à l'encodage du fichier php et à l'encodage lors de l'affichage de la page Web. Pour utiliser cette méthode mb_substr, vous devez connaître l'encodage de la chaîne à l'avance. Si vous ne connaissez pas l'encodage, vous devez juger. La bibliothèque mbstring fournit également mb_check_encoding pour vérifier l'encodage de la chaîne, mais ce n'est pas encore parfait. .

PHP est livré avec plusieurs fonctions d'interception de chaînes, parmi lesquelles substr et mb_substr sont couramment utilisées. Lorsque le premier traite le chinois, GBK correspond à 2 unités de longueur et UTF à 3 unités de longueur. Après que le second ait spécifié le codage, un caractère chinois correspond à 1 unité de longueur.

substr coupe parfois 1/3 du chinois ou la moitié du chinois et affiche des caractères tronqués. Relativement parlant, mb_substr nous convient mieux. Mais parfois, mb_substr ne semble pas si utile. Par exemple, si je souhaite afficher les brèves informations d'une petite image, 5 caractères chinois suffisent. S'il y a plus de 5 caractères, interceptez simplement les 4 premiers et ajoutez "...". De cette façon, il n'y a aucun problème dans le traitement des caractères chinois, mais lors du traitement de l'anglais ou des chiffres, cette interception serait trop courte.

2. Écrivez vous-même la fonction d'interception, mais l'efficacité n'est pas aussi élevée que l'utilisation de la bibliothèque d'extension mbstring. Ce qui suit est une fonction d'ecshop qui intercepte les chaînes codées en UTF-8.

function sub_str($str, $length = , $append = true)
{
  $str = trim($str);
  $strlength = strlen($str);
  if ($length == || $length >= $strlength)
  {
    return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身
  }
  elseif ($length < ) //如果截取长度为负数
  {
    $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
    if ($length < )
    {
      $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
    }
  }
  if (function_exists(&#39;mb_substr&#39;))
  {
    $newstr = mb_substr($str, , $length, EC_CHARSET);
  }
  elseif (function_exists(&#39;iconv_substr&#39;))
  {
    $newstr = iconv_substr($str, , $length, EC_CHARSET);
  }
  else
  {
    //$newstr = trim_right(substr($str, , $length));
    $newstr = substr($str, , $length);
  }
  if ($append && $str != $newstr)
  {
    $newstr .= &#39;...&#39;;
  }
  return $newstr;
}
Copier après la connexion

Résumé :

Cet article utilise deux exemples pour présenter la solution aux caractères chinois tronqués lors de l'interception de chaînes en PHP . Je crois que si des amis ont le même problème, ils peuvent facilement le résoudre !

Recommandations associées :

Instances de PHP interceptant des chaînes chinoises et obtenant le nombre de caractères dans les chaînes chinoises


Introduction à la façon d'intercepter des chaînes avec PHP

Interception PHP Explication détaillée de l'utilisation de la fonction de chaîne, exemple de fonction substr()

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal