python - Comment obtenir le contenu souhaité en incluant la balise <dl></dl>
ringa_lee
ringa_lee 2017-05-18 10:49:18
0
2
583

1. Lorsque j'ajoute la balise <dl>, j'obtiens du contenu vide. Comment dois-je écrire les règles de correspondance pour obtenir le contenu souhaité sans ajouter la balise <dl>

pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>')

3. Vous pouvez obtenir le contenu souhaité sans ajouter la balise <dl>

4. Ci-joint le code source de la page Web

<dl>
                <dt>《明末工程师》正文</dt>
                <dd><a href="/book/1440/xx">第一章 穿越后的窘境</a></dd>
</dl>
ringa_lee
ringa_lee

ringa_lee

répondre à tous(2)
黄舟
# 你可能需要加个模式
# re.S    使 . 匹配包括换行在内的所有字符
pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>', re.S)
print re.findall(pattern, a)
迷茫
// /需要转义下
<dl>.*?<dd><a href="(.*?)">(.*?)<\/a><\/dd>.*?<\/dl>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal