Maison > développement back-end > Tutoriel Python > Comment puis-je faire correspondre de manière fiable des chaînes avec des caractères spéciaux à l'aide des limites de mots de Python ?

Comment puis-je faire correspondre de manière fiable des chaînes avec des caractères spéciaux à l'aide des limites de mots de Python ?

Linda Hamilton
Libérer: 2024-12-07 14:17:12
original
945 Les gens l'ont consulté

How Can I Reliably Match Strings with Special Characters Using Python's Word Boundaries?

Limites de mots et caractères spéciaux en Python

Lors de l'utilisation du modèle b pour la correspondance des limites de mots dans les expressions régulières Python, des résultats inattendus peuvent se produire lorsque le modèle de recherche contient des caractères spéciaux tels que des crochets ou des accolades.

Plus précisément, b ne correspond qu'aux limites des mots où le caractère suivant est un caractère de mot. (alphanumérique ou trait de soulignement). Cela signifie que bSortesindex[persons]{Sortes}, par exemple, ne correspondra pas au texte de test Sortesindex[persons]{Sortes} car Sortes est suivi d'un caractère spécial (}index).

Pour garantir une correspondance appropriée, envisagez ces solutions :

  • Adaptive Word Limites :

    • Utilisez des limites de mots adaptatives qui correspondent au début ou à la fin d'une chaîne ou entre des caractères avec un statut de caractère de mot différent :

      re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
      Copier après la connexion
  • Mot sans ambiguïté Limites :

    • Utilisez des limites de mots sans ambiguïté pour n'exiger strictement aucun caractère de mot des deux côtés de la correspondance :

      re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
      Copier après la connexion
  • Gérer explicitement les non-mots Limites :

    • Gérez explicitement les limites autres que les mots en utilisant W ou $, telles que :

      re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')
      Copier après la connexion

De plus, envisagez d'utiliser des recherches négatives pour plus de flexibilité dans la définition des limites des mots. Par exemple, (?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal