communauté Apprendre Bibliothèque d'outils Loisirs

Français

Maison > développement back-end > Tutoriel Python > Comment décoder des entités HTML en Python ?

Comment décoder des entités HTML en Python ?

DDD

Libérer： 2024-12-16 05:20:13

original

370 Les gens l'ont consulté

How to Decode HTML Entities in Python?

Décodage des entités HTML en Python : une référence complète

Lors de l'analyse du contenu HTML à l'aide de BeautifulSoup, on peut rencontrer des problèmes avec les entités HTML restant encodées. Pour décoder ces entités et obtenir le contenu textuel réel, diverses approches peuvent être utilisées en fonction de la version de Python utilisée.

Python 3.4

Dans Python 3.4 et supérieur, le html.unescape() La fonction offre une méthode simple pour décoder les entités HTML :

import html
print(html.unescape('&amp;pound;682m'))

Copier après la connexion

Cela renverra le résultat souhaité : "682 millions de livres sterling".

Python 2.6-3.3

Pour les versions Python comprises entre 2.6 et 3.3, la méthode HTMLParser.unescape() s'avère utile :

try:
    # Python 2.6-2.7
    from HTMLParser import HTMLParser
except ImportError:
    # Python 3
    from html.parser import HTMLParser

h = HTMLParser()
print(h.unescape('&amp;pound;682m'))

Copier après la connexion

Alternativement, les six bibliothèques de compatibilité peuvent simplifier les importations de modules, permettant l'utilisation de HTMLParser sur Python versions :

from six.moves.html_parser import HTMLParser
h = HTMLParser()
print(h.unescape('&amp;pound;682m'))

Copier après la connexion

En utilisant ces outils Python, les développeurs peuvent décoder efficacement les entités HTML et obtenir le contenu textuel souhaité pour leurs besoins d'analyse.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source：php.cn

Article précédent：Comment puis-je exécuter du code Python à partir d’une chaîne ? Article suivant：Que sont les mixins et en quoi diffèrent-ils de l’héritage multiple ?

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Espaces de noms ou méthodes statiques pour regrouper des fonctions : quelle approche est la meilleure ?

2024-12-16 13:50:11
Pourquoi l'imbrication « async/await » dans les constructeurs de promesses est-elle un anti-modèle ?

2024-12-16 13:49:12
Comment KeyEventDispatcher de Java peut-il éliminer le délai de répétition du clavier dans les applications Swing ?

2024-12-16 13:48:11
Comment puis-je créer un tableau CSS uniquement compatible avec les anciens navigateurs IE ?

2024-12-16 13:47:18
Supprimer ou épisser : quelle méthode de suppression d'éléments de tableau JavaScript devriez-vous choisir ?

2024-12-16 13:46:12
Comment puis-je obtenir les dimensions de l'écran, de la page Web et de la fenêtre du navigateur en JavaScript ?

2024-12-16 13:45:15
Faiss avec sqlite pour RAG

2024-12-16 13:44:16
Explorer l'utilisation de Java pour le développement de jeux

2024-12-16 13:43:12
Fantasian Neo Dimension : Procédure pas à pas de la toundra gelée

2024-12-16 13:42:11
Indiana Jones et le Grand Cercle : Comment gagner de l'argent rapidement

2024-12-16 13:40:10

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2197

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

2347

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

1965

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

1853

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

1914

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal