Diviser les chaînes tout en préservant les phrases citées
La tâche consiste à exploser une chaîne donnée en un tableau de mots, avec l'exigence unique qui cite les phrases sont traitées comme des unités uniques.
Pour y parvenir, une approche consiste à utiliser la correspondance d'expressions régulières. Un modèle approprié pour capturer à la fois des phrases citées et des mots individuels est :
"(?:\.|[^\"])*"|\S+
Ce modèle se compose de deux parties séparées par un opérateur d'alternance (|):
Pour utiliser ce modèle en PHP, on peut utiliser preg_match_all(...):
$text = 'Lorem ipsum "dolor sit amet" consectetur "adipiscing \"elit" dolor'; preg_match_all('/"(?:\.|[^\"])*"|\S+/', $text, $matches);
Cela remplira le tableau $matches avec un tableau de toutes les correspondances capturées, où les phrases citées seront isolées en tant qu'éléments uniques.
Par exemple, avec la chaîne d'entrée fournie :
Lorem ipsum "dolor sit amet" consectetur "adipiscing \"elit" dolor
La sortie de preg_match_all(...) sera :
Array ( [0] => Array ( [0] => Lorem [1] => ipsum [2] => "dolor sit amet" [3] => consectetur [4] => "adipiscing \"elit" [5] => dolor ) )
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!