Comprendre les correspondances qui se chevauchent entre Regex
Lors de l'utilisation de re.findall() pour faire correspondre des expressions régulières, il est crucial de comprendre comment les correspondances qui se chevauchent sont gérées. Par défaut, re.findall() renvoie des correspondances qui ne se chevauchent pas.
Étude de cas : bonjour et ww
Considérez le modèle suivant :
>>> match = re.findall(r'\w\w', 'hello') >>> print match ['he', 'll']
Comme prévu, ce modèle correspond à des séquences de deux caractères. Cependant, il ne correspond pas à « el » ou « lo », car ils se chevauchent respectivement avec « il » et « ll ».
Correspondances superposées avec assertions anticipées
Pour trouver des correspondances qui se chevauchent, une assertion anticipée peut être utilisée. Une assertion anticipée, notée (?=...), vérifie si un modèle spécifié existe ensuite sans consommer la chaîne d'entrée.
En utilisant ce concept, l'expression suivante capture avec succès les correspondances qui se chevauchent et qui ne se chevauchent pas :
>>> re.findall(r'(?=(\w\w))', 'hello') ['he', 'el', 'll', 'lo']
Le modèle se lit désormais : "trouver n'importe quel endroit suivi d'un mot à deux caractères." Cela garantit que toutes les séquences correspondantes possibles, y compris celles qui se chevauchent et celles qui ne se chevauchent pas, sont capturées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!