Java – Problem mit regulären Ausdrücken
ringa_lee
ringa_lee 2017-06-14 10:53:06
0
1
940

Ich möchte reguläre Ausdrücke verwenden, um die folgenden Informationen zu extrahieren. Wie soll ich sie schreiben?

123 男 北京          张三
343 女 河北 石家庄   李四
2343 男 山东         王五



提取 男 张三
     女 李四
     男 王五
ringa_lee
ringa_lee

ringa_lee

Antworte allen(1)
洪涛

其实对于中文, 特别是这样格式的中文, 我是不建议用正则的, 虽然勉强也能实现:

# coding: utf8
import re
filename = '2.txt'
patern = re.compile(r'^\d+ (\S+).*?(\S+)')
with open(filename) as f:
    for i in f:
        result = patern.findall(i[:-1])
    
        if result and len(result[0]) == 2:
            print result[0][0], result[0][1]
            
# 输出:
男 北京
女 河北
男 山东

你也可以用split的方法(建议):

# coding: utf8
filename = '2.txt'
with open(filename) as f:
    for i in f:
        result = i.split()
        print result[1], result[-1]
    
# 输出:
男 北京
女 河北
男 山东
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage