Maison > développement back-end > Problème PHP > Que faire si php substr intercepte des chaînes tronquées

Que faire si php substr intercepte des chaînes tronquées

藏色散人
Libérer: 2023-03-08 18:48:01
original
2698 Les gens l'ont consulté

Solution pour php substr interceptant les chaînes tronquées : 1. Utilisez le "mb_substr()" de la bibliothèque d'extension mbstring pour intercepter, avec la syntaxe "mb_substr(string, Starting position, Character length, "character encoding") "; 2. Utilisez la fonction d'ecshop pour intercepter les chaînes codées en UTF-8.

Que faire si php substr intercepte des chaînes tronquées

L'environnement d'exploitation de cet article : système Windows 7, version PHP 8, ordinateur DELL G3

Dans le développement de programmes PHP, l'interception de chaînes est souvent effectué Par exemple, lors de la sortie d'une liste d'informations, le titre ne doit pas être trop long. Lors de l'impression d'un résumé d'article, une série d'opérations d'interception de chaîne doit également être effectuée. Lorsque nous rencontrons ces exigences, nous pensons souvent à utiliser la méthode substr() pour y parvenir, substr() est plus adaptée pour intercepter des chaînes entièrement anglaises.

Mais tant que des caractères chinois apparaissent dans la chaîne, cela peut provoquer des caractères chinois tronqués dans PHP, car encodage chinois UTF-8, chaque caractère chinois occupe 3 octets, tandis que GB2312 occupe 2 octets et l'anglais occupe 1. byte , le nombre de chiffres interceptés n'est pas précis, substr() "scie" brusquement un caractère chinois en deux, ce qui fait que le caractère brisé rassemble les éléments suivants... pour former un mot, donc des caractères chinois tronqués PHP substr apparaissent.

substr --- Récupère une partie de la chaîne

Syntaxe : string substr (string string, int start [, int length])

Explication :

  • substr() renvoie une partie de chaîne, spécifiée par les paramètres start et length.

  • Si start est un nombre positif, la chaîne renvoyée commencera à partir du caractère de début de la chaîne.

Exemple :

<?php
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>
Copier après la connexion

Si start est un nombre négatif, la chaîne renvoyée commencera à partir du mot de début à la fin de la chaîne.

Exemple :

<?php
$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>
Copier après la connexion

Si le paramètre length est donné et est un nombre positif, la chaîne renvoyée aura une longueur de caractères à partir du début.
Si le paramètre length est donné et est un nombre négatif, la chaîne renvoyée se terminera au ième caractère de la longueur à partir de la fin de la chaîne.

Exemple :

<?php
$rest = substr ("abcdef", 1, -1); // returns "bcde"
?>
Copier après la connexion

n'est pas un problème pour l'anglais. Nous testons un chinois

<?php
$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
?>
Copier après la connexion

Le résultat de l'interception de caractères n'est certainement pas le résultat que nous souhaitons. Les caractères chinois tronqués de substr peuvent empêcher le programme de fonctionner normalement. Il existe deux solutions principales :

1. Utilisez la fonction mb_substr() de la bibliothèque d'extension mbstring pour intercepter et éviter les caractères tronqués.

Vous pouvez utiliser la fonction mb_substr()/mb_strcut(). L'utilisation de mb_substr()/mb_strcut() est similaire à substr(), sauf que vous devez en ajouter plus à. la fin de mb_substr()/mb_strcut Un paramètre pour définir l'encodage de la chaîne, mais la plupart des serveurs n'ouvrent pas php_mbstring.dll Vous devez ouvrir php_mbstring.dll dans php.ini.

<?php
  echo mb_substr("php中文字符encode",0,4,"utf-8");
?>
Copier après la connexion

Si le dernier paramètre d'encodage n'est pas spécifié, trois octets seront utilisés comme un caractère chinois. C'est la caractéristique de l'encodage utf-8. Si la description du jeu de caractères utf-8 est ajoutée, elle le sera. un caractère intercepté pour l’unité.

Lors de son utilisation, faites attention à l'encodage du fichier php et à l'encodage lors de l'affichage de la page Web. Pour utiliser cette méthode mb_substr, vous devez connaître l'encodage de la chaîne à l'avance. Si vous ne connaissez pas l'encodage, vous devez juger. La bibliothèque mbstring fournit également mb_check_encoding pour vérifier l'encodage de la chaîne, mais ce n'est pas encore parfait. .

PHP est livré avec plusieurs fonctions d'interception de chaînes, parmi lesquelles substr et mb_substr sont couramment utilisées. Lorsque le premier traite le chinois, GBK correspond à 2 unités de longueur et UTF à 3 unités de longueur. Après que le second ait spécifié le codage, un caractère chinois correspond à 1 unité de longueur.

substr coupe parfois 1/3 du chinois ou la moitié du chinois et affiche des caractères tronqués. Relativement parlant, mb_substr nous convient mieux. Mais parfois, mb_substr n'est pas si simple à utiliser. Par exemple, si je souhaite afficher les brèves informations d'une petite image, 5 caractères chinois suffisent. S'il y a plus de 5 caractères, interceptez simplement les 4 premiers et ajoutez "...". Cela ne pose aucun problème lors du traitement. Chinois, mais lors du traitement de l'anglais ou des chiffres, cette interception sera trop courte.

2. Écrivez vous-même la fonction d'interception, mais l'efficacité n'est pas aussi élevée que l'utilisation de la bibliothèque d'extension mbstring. Ce qui suit est une fonction d'ecshop qui intercepte les chaînes codées en UTF-8.

function sub_str($str, $length = , $append = true)
{
  $str = trim($str);
  $strlength = strlen($str);
  if ($length == || $length >= $strlength)
  {
    return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身
  }
  elseif ($length < ) //如果截取长度为负数
  {
    $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
    if ($length < )
    {
      $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
    }
  }
  if (function_exists(&#39;mb_substr&#39;))
  {
    $newstr = mb_substr($str, , $length, EC_CHARSET);
  }
  elseif (function_exists(&#39;iconv_substr&#39;))
  {
    $newstr = iconv_substr($str, , $length, EC_CHARSET);
  }
  else
  {
    //$newstr = trim_right(substr($str, , $length));
    $newstr = substr($str, , $length);
  }
  if ($append && $str != $newstr)
  {
    $newstr .= &#39;...&#39;;
  }
  return $newstr;
}
Copier après la connexion

D'accord, c'est toute la description dans cet article, je pense que cela vous apportera quelque chose. Le code ci-dessus est également très simple. Si vous ne comprenez rien, laissez-moi. un message. Je répondrai à tout le monde dans les plus brefs délais.

Apprentissage recommandé : "Tutoriel vidéo PHP"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
php
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal