Heim  >  Artikel  >  Backend-Entwicklung  >  So entfernen Sie HTML-Tags in Python

So entfernen Sie HTML-Tags in Python

藏色散人
藏色散人Original
2021-04-28 11:00:546419Durchsuche

So entfernen Sie HTML-Tags in Python: 1. Methode „pattern.sub('',html)“ 2. Methode „BeautifulSoup(html,'html.parser‘)“; ( .)')"Methode.

So entfernen Sie HTML-Tags in Python

Die Betriebsumgebung dieses Artikels: Windows 7-System, Python-Version 3.6.4, DELL G3-Computer.

Mehrere Möglichkeiten zum Entfernen von HTML-Tags in Python

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = &#39;<p>你好</p><br/><font>哈哈</font><b>大家好</b>&#39;
 
# 方法一
pattern = re.compile(r&#39;<[^>]+>&#39;,re.S)
result = pattern.sub(&#39;&#39;, html)
print(result)
 <br># 方法二
soup = BeautifulSoup(html,&#39;html.parser&#39;)
print(soup.get_text())
 
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath(&#39;string(.)&#39;))
 
 
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好

[Empfohlen: Python-Video-Tutorial]

Das obige ist der detaillierte Inhalt vonSo entfernen Sie HTML-Tags in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn