Die Verwendung regulärer Ausdrücke zum Extrahieren von Inhalten aus Webseiten ist ziemlich umständlich. Hier ist eine Python-Bibliothek, die Daten aus HTML- oder XML-Dateien extrahieren kann: Beautiful Soup kann über Ihren bevorzugten Konverter eine idiomatische Dokumentnavigation erreichen, wie Sie suchen und ändern Dokumente. Beautiful Soup hilft Ihnen, Stunden oder sogar Tage an Arbeit zu sparen.
Die spezifische Anwendung wurde im offiziellen Dokument klar beschrieben, hier gibt es keine weiteren Details. Lassen Sie mich über die Probleme sprechen, auf die ich während der Installation gestoßen bin.
1. Python3 installieren
Laden Sie Python3 von der offiziellen Website herunter und installieren Sie es, fügen Sie die Path-Variable hinzu und benennen Sie die installierte Datei python.exe in python3.exe um
2. Installieren Sie pip3
Eingabe:>pip3
Problemmeldung: Schwerwiegender Fehler im Launcher: Prozess kann mit „“ nicht erstellt werden
Eingabe:>python3 -m pip install --upgrade pip
Problemaufforderung: Anforderung bereits aktuell: pip in c:users****appdatalocalprogramspythonpython36-32libsite-packages
Eingabe:>python3 -m pip install --upgrade pip --force-reinstall
Ausgabe:
Eingabe: >pip3 -V
Ausgabe: pip 9.0.1 von c:users****appdatalocalprogramspythonpython36-32libsite- Pakete (Python 3.6)
pip3-Installation abgeschlossen
3. Installieren Sie BeautifulSoup4
>pip3 install beautifulsoup4
Wenn Sie mit Quellcode installieren möchten, Laden Sie den Quellcode von BS4 herunter und installieren Sie ihn dann über setup.py.
Dekomprimieren Sie das heruntergeladene komprimierte Paket lokal und verwenden Sie den Befehl, um es in Python3-Code zu konvertieren:
Geben Sie Toolsscripts in die Python-Installation ein Verzeichnis, das 2to3.py enthält, verwenden Sie den Befehl zum Konvertieren von
Python36-32Toolsscripts>python 2to3.py -w C:Users****AppDataLocalProgramsPythonPython36-32beautifulsoup4-4.6.0
Verwenden Geben Sie an der Eingabeaufforderung das BS4-Dekomprimierungsverzeichnis ein und starten Sie die Installation:
>python setup.py install
4. Installieren Sie den Parser:
>pip3 install lxml
>pip3 install html5lib
Die Installation ist abgeschlossen! Es ist Zeit, mit dem Testen zu beginnen.
Es gibt viele BeautifulSoup3- und Python2-Codes im Internet, und beim Testen mit den bereitgestellten Demos können verschiedene Probleme auftreten. Es wird empfohlen, beim Erlernen neuer Inhalte direkt auf die offizielle Dokumentation zurückzugreifen.
Das obige ist der detaillierte Inhalt vonBeispiel-Tutorial zur Installation von Python3+BeautifulSoup4. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!