XPath mit BeautifulSoup verwenden: Eine Geschichte zweier Bibliotheken
Die beliebte BeautifulSoup-Bibliothek bietet praktische Methoden zum Parsen von HTML und zum Scrapen von Daten. Allerdings fehlen ihm von Haus aus XPath-Funktionen, trotz seiner breiten Verwendung beim Web-Scraping.
Um XPath-Ausdrücke zu nutzen, sollten Sie die Einführung von lxml in Betracht ziehen, einer alternativen Bibliothek, die BeautifulSoup-Kompatibilität und vollständige XPath 1.0-Unterstützung bietet. So verwenden Sie XPath mit lxml:
from lxml import etree # Parse HTML tree = etree.parse(response, etree.HTMLParser()) # Search using XPath results = tree.xpath(xpathselector)
Wenn Sie externe Abhängigkeiten lieber vermeiden möchten, bietet BeautifulSoup Unterstützung für CSS-Selektoren. Dies ermöglicht eine prägnantere Suche durch die Übersetzung von CSS-Anweisungen in XPath-Ausdrücke:
for cell in soup.select('table#foobar td.empformbody'): # Perform desired operations on table cells
Das obige ist der detaillierte Inhalt vonKann ich XPath mit BeautifulSoup verwenden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!