L'expression régulière elle-même est une connaissance indépendante du langage de programmation, mais elle dépend également du langage de programmation. Fondamentalement, le langage de programmation que nous utilisons assure sa mise en œuvre. Bien sûr, chaque entreprise présente également quelques différences. mise en œuvre, certains prennent en charge plus de fonctions et d’autres moins.
Étant donné que les expressions régulières sont un outil largement utilisé dans la pratique, je pense qu'il n'est pas fiable de les apprendre sans langage.
Diagramme de relation entre l'API principale et l'expression régulière
Ce diagramme est mon résumé personnel. Je pense avoir fondamentalement clarifié la relation entre les fonctions ici. Leurs fonctions sont :
. match correspond à l'expression régulière du début du texte et renvoie l'objet correspondant. Sinon, il renvoie None
search Correspond à l'expression régulière dans tout le texte et renvoie le premier objet correspondant. Sinon, il renvoie None .
sub utilise des expressions régulières pour le remplacement de texte (fonction des expressions régulières : rechercher et remplacer)
findall correspond aux expressions régulières du texte entier et renvoie tous les résultats correspondants sous la forme d'une liste.
finditer correspond à une expression régulière du texte entier, renvoyant tous les résultats correspondants en tant qu'itérateur.
split utilise des expressions régulières pour diviser le texte
Comme vous pouvez le voir ici, de nombreuses fonctions peuvent être utilisées immédiatement sous ·re·, et il existe de nombreuses fonctions portant le même nom sous re Fonction .compile
. Directement sous le module ·re· se trouvent officiellement des fonctions pour une utilisation facile, et la manière la plus orthodoxe de les utiliser est d'utiliser re.compile
. re.compile
下面有很多同名的函数。直接在 ·re· 模块下的是官方提供方便使用的函数,通过 re.compile
来使用是最正统的方式。所以,接下来的内容,我基本上智慧使用 re.compile
及其下的方法来实现。
compile
函数用于编译正则表达式,生成一个正则表达式 (Pattern)对象,供 match()
和 search()
以及其它函数使用。
语法:
re.compile(pattern[, flags])
pattern: 一个字符串形式的正则表达式
flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 多行模式
re.S 即为 '.' 并且包括换行符在内的任意字符('.' 不包括换行符)
re.U 表示特殊字符集 w, W, b, B, d, D, s, S 依赖 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 ‘#’ 后面的注释
示例:查找字符串中的所有数字
import re s = 'runoob 123 google 456' result1 = re.findall(r'\d+', s) pattern = re.compile(r'\d+') # 查找数字 result2 = pattern.findall(s) result3 = pattern.findall(s, 0, 20) print(result1) print(result2) print(result3) """ output: [‘123', ‘456'] [‘123', ‘456'] [‘123', ‘45'] """
接下来我们要逐渐学习正则表达的内容,这些内容是非常有趣的!Interesting and Excited!
这里给出一个接下来会一直使用的示例模板,这个模板是这篇博客最重要的东西了,之后的内容都会基于它进行扩展。所以,请好好理解它。
import re # 需要进行搜索或者匹配的文本 text = """I love you yesterday and today.""" # 正则表达式 regexp = r'love' # 编译(对正则表达式进行编译获取 Pattern Object) pattern = re.compile(regexp) # 搜索 m = pattern.search(text) if m: print("匹配对象: ", m) print("匹配的字符串: ", m.group()) print("匹配的开始位置: ", m.start()) print("匹配的结束位置: ", m.end()) print("匹配位置的元组: ", m.span()) else: print("No match!") # 替换 new_text = pattern.sub("hate", text) print(new_text)
注意: 正则表达式 regexp 在开始前会使用 r
Donc, pour le contenu suivant, j'utilise essentiellement re.compile
et les méthodes ci-dessous pour y parvenir.
compile
est utilisée pour compiler des expressions régulières et générer un objet d'expression régulière (Pattern) pour match()
et search( )
et d'autres fonctions. pattern : une expression régulière sous la forme d'une chaîne | |
re.I Ignorer la casse | |
re.L Mode multiligne | |
re.U représente le jeu de caractères spéciaux w, W, b, B, d, D, s, S et s'appuie sur la base de données d'attributs de caractères Unicode | |
re.X pour augmenter la lisibilité, ignorer les espaces et commentaires après ‘#’ |
r
avant de démarrer. Le but est d'éviter d'utiliser un grand nombre de caractères d'échappement dans l'expression régulière, ce qui détruit la lisibilité globale. 🎜🎜Les expressions régulières de Python incluent de nombreuses méthodes très faciles à utiliser, mais je ne les présenterai pas trop ici. Nous utiliserons toujours le modèle ci-dessus, car ces méthodes faciles à utiliser n’en sont qu’une sorte d’encapsulation, et apprendre à utiliser cette méthode de base en mènera naturellement à d’autres. 🎜🎜L'objet correspondant peut obtenir des informations sur les expressions régulières. Ses méthodes et propriétés les plus importantes sont : 🎜🎜🎜🎜🎜Méthodes/Propriétés 🎜🎜Objectif🎜🎜🎜🎜🎜🎜group()🎜🎜Renvoyer la chaîne correspondante régulière 🎜🎜🎜 🎜start()🎜🎜Renvoie la position de départ du match🎜🎜🎜🎜end()🎜🎜Renvoie la position de fin du match🎜🎜🎜🎜span()🎜🎜Renvoie un tuple contenant la position correspondante (début, fin) 🎜 🎜🎜🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!