PythonでHTMLタグを削除する方法

藏色散人
リリース: 2023-01-05 16:12:17
オリジナル
6247 人が閲覧しました

HTML タグを削除する Python メソッド: 1. "pattern.sub('',html)" メソッド; 2. "BeautifulSoup(html,'html.parser')" メソッド; 3. "response.xpath" 「('string(.)')」メソッド。

PythonでHTMLタグを削除する方法

この記事の動作環境: Windows 7 システム、Python バージョン 3.6.4、DELL G3 コンピューター。

Python で HTML タグを削除するいくつかの方法

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = '

你好


哈哈大家好' # 方法一 pattern = re.compile(r'<[^>]+>',re.S) result = pattern.sub('', html) print(result)
# 方法二 soup = BeautifulSoup(html,'html.parser') print(soup.get_text()) # 方法三 response = etree.HTML(text=html) # print(dir(response)) print(response.xpath('string(.)')) # 你好哈哈大家好 # 你好哈哈大家好 # 你好哈哈大家好
ログイン後にコピー

[推奨: Python ビデオ チュートリアル]

以上がPythonでHTMLタグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!