コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Python で HTML エンティティをデコードするには?

Python で HTML エンティティをデコードするには?

DDD

リリース： 2024-12-16 05:20:13

オリジナル

378 人が閲覧しました

How to Decode HTML Entities in Python?

Python での HTML エンティティのデコード: 包括的なリファレンス

BeautifulSoup を使用して HTML コンテンツを解析すると、HTML エンティティがエンコードされたままになるという問題が発生する可能性があります。これらのエンティティをデコードして実際のテキストコンテンツを取得するには、使用している Python のバージョンに応じてさまざまなアプローチを使用できます。

Python 3.4

Python 3.4 以降では、html.unescape()関数は、HTML エンティティをデコードするための簡単な方法を提供します。

import html
print(html.unescape('&amp;pound;682m'))

ログイン後にコピー

これにより、目的の出力が返されます。 "£682m".

Python 2.6-3.3

Python バージョン 2.6 から 3.3 の場合、HTMLParser.unescape() メソッドが便利です。

try:
    # Python 2.6-2.7
    from HTMLParser import HTMLParser
except ImportError:
    # Python 3
    from html.parser import HTMLParser

h = HTMLParser()
print(h.unescape('&amp;pound;682m'))

ログイン後にコピー

あるいは、次のようになります。 6 つの互換性ライブラリによりモジュールのインポートが簡素化され、HTMLParser の使用が可能になります。 Python バージョン:

from six.moves.html_parser import HTMLParser
h = HTMLParser()
print(h.unescape('&amp;pound;682m'))

ログイン後にコピー

これらの Python ツールを利用することで、開発者は HTML エンティティを効率的にデコードし、解析ニーズに応じて必要なテキストコンテンツを取得できます。

以上がPython で HTML エンティティをデコードするには?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース：php.cn

前の記事：文字列から Python コードを実行するにはどうすればよいですか? 次の記事：ミックスインとは何ですか? 多重継承との違いは何ですか?

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

Swing アプリケーションでキーリスナーの代わりにキーバインディングを使用する理由

2024-12-17 00:50:25
Go で Unix タイムスタンプを安全に解析するにはどうすればよいですか?

2024-12-17 00:49:25
「pass」を使用してPythonで例外をサイレントに抑制する方法?

2024-12-17 00:48:25
PHP でユーザーの正確な IP アドレスを取得するにはどうすればよいですか?

2024-12-17 00:47:25
Java で JSONObject を反復処理してその要素にアクセスするにはどうすればよいですか?

2024-12-17 00:46:24
「int x = x;」の未定義の動作は左辺値から右辺値への変換によるものですか?

2024-12-17 00:45:24
組み込みデータ型 (char、short、int、float、double) 間のパフォーマンスの違いは、最新のプログラミングにどのような影響を及ぼしますか?

2024-12-17 00:44:26
PHP が偽のブール値をエコーしないのはなぜですか?それを修正するにはどうすればよいですか?

2024-12-17 00:43:25
Go で GOPATH に関連するファイルを移植可能に開くにはどうすればよいですか?

2024-12-17 00:42:24
不透明度:0 と可視性:非表示: 本当の違いは何ですか?

2024-12-17 00:41:24

最新の問題

function_exists() はカスタム関数を決定できません Function test () {return true;} if (function_exists ('test')) {echo "テストは関数です";

から 2024-04-29 11:01:01

0

3

2205

Google Chromeのモバイル版を表示する方法こんにちは、先生、Google Chrome をモバイル版に変更するにはどうすればよいですか?

から 2024-04-23 00:22:19

0

11

2352

子ウィンドウは親ウィンドウを操作しますが、出力は応答しません。最初の 2 つの文は実行可能ですが、最後の文は実装できません。

から 2024-04-19 15:37:47

0

1

1969

親ウィンドウには出力がありません document.onclick = function(){ window.opener.document.write('私は子ウィンドウの出力です');

から 2024-04-18 23:52:34

0

1

1857

CSS マインドマッピングに関するコースウェアはどこにありますか? コースウェア

から 2024-04-16 10:10:18

0

0

1920

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート