Utilisation des expressions XPath en Python
XPath est un langage utilisé pour la navigation et la recherche dans les documents XML et HTML. Il est largement utilisé dans le grattage de données, les tests d'automatisation Web, l'extraction de texte et d'autres domaines. En Python, nous pouvons utiliser la bibliothèque lxml pour analyser des documents XML et HTML et utiliser des expressions XPath pour localiser et extraire les données requises.
pip install lxml
from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse('example.html', parser)
xpath_expr = '//a'
nodes = tree.xpath(xpath_expr)
texts = [node.text for node in nodes] print(texts)
Ce qui suit est un exemple de code complet qui montre comment extraire tous les liens d'un document HTML :
from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.html', parser) xpath_expr = '//a' nodes = tree.xpath(xpath_expr) links = [node.get('href') for node in nodes] print(links)
Ce qui précède est utilisé dans Python Utilisation de base des expressions XPath. En maîtrisant la syntaxe XPath et en utilisant la bibliothèque lxml, nous pouvons facilement analyser et extraire des données de documents XML et HTML, fournissant ainsi un outil puissant pour des tâches telles que l'analyse de données et l'exploration du Web.
J'espère que cet article pourra vous aider à comprendre et à utiliser les expressions XPath en Python. Je vous souhaite du succès dans le traitement des données et le développement web !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!