Python正则表达式【1】

黄舟
黄舟 原创
2017-02-07 16:28:53 1027浏览

本文来说说Python的正则表达式。

废话不多说了,先开始最简单的:

'.':可以匹配除换行符以外的任意单个字符(就是个点)。

'*'可以匹配前面的子表达式零次或多次(就是个星号)。

所以上面两个的组合'.*'(点星)就是匹配除换行符以外的所有。

'+':重复一次或更多次。

'?':重复零次或一次。

'\d':匹配一个数字字符。等价于 [0-9]。

'\w'匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。

'/s'匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]

'^'匹配输入字符串的开始位置。

'$'匹配输入字符串的结束位置。

上面这几个超级常用,当然常用的还有很多,需要的时候请查手册。

这样描述不够直观,直接敲实验。想在Python里使用正则表达式很简单,直接导入re即可:

>>> import re

>>>

先试试匹配所有:

>>> vlan = 'switchport access vlan 612'
>>> ljds = re.search('.*',vlan).group()
>>> ljds
'switchport access vlan 612'

再试试匹配数字:

>>> ljds = re.search('\d',vlan).group()
>>> ljds
'6'

因为'/d'是匹配一个数字,所以如果要匹配这里的‘612’,三个数字,可以加上'{3}':

>>> ljds = re.search('\d{3}',vlan).group()
>>> ljds

'612'

同理,如果要匹配13个字符(包括空格):

>>> ljds = re.search('[\w\s]{13}',vlan).group()
>>> ljds
'switchport ac'

这里还想提一下正则表达式的量词里面涉及到贪婪和非贪婪模式,贪婪就是取最大值,尽可能多的匹配。非贪婪就正好相反(默认是贪婪模式)。举例说明:

刚才上面是匹配13个字符,如果写成匹配2到10个字符就写成:'[\w\s]{2,10}'即可,那么到底匹配的是2个还是10个呢?因为默认是贪婪模式,它会最大的匹配:

>>> ljds = re.search('[\w\s]{2,10}',vlan).group()
>>> ljds
'switchport'

在量词后面加个问号'?',就切换到了非贪婪模式,即最小匹配:

>>> ljds = re.search('[\w\s]{2,10}?',vlan).group()
>>> ljds
'sw'

接下来介绍一下“捕获”了:

(exp):匹配exp。

(?=exp):匹配exp前面的位置。

(?<=exp):匹配exp后面的位置。

>>> vlan = 'switchport access vlan 612'

最基础的:

>>> ljds = re.search('(access)',vlan).group()
>>> ljds
'access'

匹配'access'之前的任意字符:

>>> ljds = re.search('.*(?=access)',vlan).group()
>>> ljds
'switchport '

匹配'vlan'之后的任意字符:

>>> ljds = re.search('(?<=vlan).*',vlan).group()
>>> ljds
' 612'

OK,学到这里,再看看之前捕获路由器名称的正则表达式:

DeviceName = re.search('.*(?=#show run)',telreply).group()

以上就是Python正则表达式【1】的内容,更多相关内容请关注PHP中文网(m.sbmmt.com)!


声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。