파이썬에서 html 태그를 제거하는 방법: 1. "pattern.sub('',html)" 방법 2. "BeautifulSoup(html,'html.parser')" 방법 3. "response.xpath('string) ( .)')"방법.
이 기사의 운영 환경: Windows 7 시스템, Python 버전 3.6.4, DELL G3 컴퓨터.
Python에서 html 태그를 제거하는 여러 가지 방법
import re from bs4 import BeautifulSoup from lxml import etree html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>' # 方法一 pattern = re.compile(r'<[^>]+>',re.S) result = pattern.sub('', html) print(result) <br># 方法二 soup = BeautifulSoup(html,'html.parser') print(soup.get_text()) # 方法三 response = etree.HTML(text=html) # print(dir(response)) print(response.xpath('string(.)')) # 你好哈哈大家好 # 你好哈哈大家好 # 你好哈哈大家好
[권장: python 비디오 튜토리얼]
위 내용은 Python에서 HTML 태그를 제거하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!