Regex correspond à un chiffre : découvrir la vraie nature de "d"
Dans le monde des regex de Python, l'énigmatique classe de caractères "d" a soulevé des questions sur son comportement de correspondance précis. Examinons sa nature énigmatique.
Dans la chaîne "123", "d" capture à la fois "1" et "3" mais exclut curieusement "2". Ce comportement particulier provient d'une nuance subtile dans la définition d'un « chiffre ».
Le « d » de Python ne correspond pas exclusivement aux chiffres du système numérique occidental (c'est-à-dire « 0-9 »). Il englobe également une gamme étendue de classes de caractères Unicode dans la catégorie « Chiffre » ou « Nd ». Ceux-ci incluent, par exemple, les chiffres arabes orientaux tels que « ٠ » et « ١ ».
Ainsi, lors de la correspondance de chiffres dans des expressions regex Python, il est crucial de reconnaître que « d » jette un réseau plus large que [0 -9]. Cette compréhension nuancée dévoile le mystère de savoir pourquoi, dans une séquence comme « 12345 », seuls les chiffres impairs (c'est-à-dire « 1 », « 3 » et « 5 ») s'alignent avec les correspondances « d », laissant les chiffres pairs. ("2" et "4") intacts.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!