Limites de mots et caractères spéciaux en Python
Lors de l'utilisation du modèle b pour la correspondance des limites de mots dans les expressions régulières Python, des résultats inattendus peuvent se produire lorsque le modèle de recherche contient des caractères spéciaux tels que des crochets ou des accolades.
Plus précisément, b ne correspond qu'aux limites des mots où le caractère suivant est un caractère de mot. (alphanumérique ou trait de soulignement). Cela signifie que bSortesindex[persons]{Sortes}, par exemple, ne correspondra pas au texte de test Sortesindex[persons]{Sortes} car Sortes est suivi d'un caractère spécial (}index).
Pour garantir une correspondance appropriée, envisagez ces solutions :
Adaptive Word Limites :
Utilisez des limites de mots adaptatives qui correspondent au début ou à la fin d'une chaîne ou entre des caractères avec un statut de caractère de mot différent :
re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Mot sans ambiguïté Limites :
Utilisez des limites de mots sans ambiguïté pour n'exiger strictement aucun caractère de mot des deux côtés de la correspondance :
re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Gérer explicitement les non-mots Limites :
Gérez explicitement les limites autres que les mots en utilisant W ou $, telles que :
re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')
De plus, envisagez d'utiliser des recherches négatives pour plus de flexibilité dans la définition des limites des mots. Par exemple, (?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!