Maison > développement back-end > Tutoriel Python > Comment puis-je analyser le HTML et accéder aux éléments à l'aide de Python ?

Comment puis-je analyser le HTML et accéder aux éléments à l'aide de Python ?

Linda Hamilton
Libérer: 2024-12-13 22:27:15
original
783 Les gens l'ont consulté

How Can I Parse HTML and Access Elements Using Python?

Analyse HTML avec Python

Question :

Comment puis-je accéder et manipuler des éléments HTML utiliser un analyseur Python ? J'ai besoin d'un module qui me permette d'obtenir les balises et leur contenu dans un format structuré, similaire à la structure imbriquée affichée dans la fonctionnalité "Inspecter l'élément" de Firefox.

Réponse :

BeautifulSoup

Le module BeautifulSoup est une bibliothèque Python populaire et puissante pour l'analyse HTML. Il peut convertir le HTML en une structure de données imbriquée, vous permettant d'accéder et de parcourir facilement les éléments HTML.

Exemple :

Pour analyser le document HTML que vous avez fourni :

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
Copier après la connexion

Pour récupérer le contenu du div "conteneur" au sein du "corps" tag :

print(parsed_html.body.find('div', attrs={'class':'container'}).text)
Copier après la connexion

Autres options :

  • lxml : Un analyseur XML et HTML rapide et efficace qui prend en charge des fonctionnalités avancées telles que comme XPath.
  • HTMLParser : Un module Python intégré qui fournit un analyseur HTML de base.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal