Rekursive Unterordnersuche und Dateiauflistung
Es kommt häufig vor, dass Sie auf Szenarien stoßen, in denen Sie mehrere Unterordner durchsuchen und bestimmte Dateien basierend darauf extrahieren müssen ihre Dateierweiterung. Ein Ansatz zur Bewältigung dieses Problems besteht darin, die in Python integrierte Funktion os.walk zu nutzen, die eine rekursive Untersuchung von Verzeichnissen und deren Inhalten ermöglicht.
Wie in dieser Frage festgestellt, tritt jedoch das problematische Verhalten auf, wenn versucht wird, die Verzeichnisse zu verketten Dateipfade. Die von os.walk zurückgegebene Variable „subFolder“ stellt eine Liste von Unterordnern dar und nicht den spezifischen Ordner, in dem sich jede Datei befindet.
Um dieses Problem zu beheben, besteht der richtige Ansatz darin, den Dirpath (oder Root im angegebenen Code) zu verwenden. , das das aktuelle Verzeichnis für die Iteration darstellt. Der dirpath-Wert sollte mit dem Dateinamen verkettet werden, um den vollständigen Dateipfad zu erstellen.
Darüber hinaus ist es wichtig, zusätzliche Faktoren zu berücksichtigen, wie z. B. das Ausschließen bestimmter Ordner aus dem Rekursionsprozess, was durch die Untersuchung des DN erreicht werden kann (Dirname-)Liste. Um zu vermeiden, dass Sie sich bei Dateierweiterungsprüfungen auf die Manipulation von Zeichenfolgen verlassen müssen, können Sie die Funktion os.path.splitext nutzen.
Hier ist eine optimierte Version des Codes, die diese Verbesserungen enthält:
<code class="python">import os result = [ os.path.join(dp, f) for dp, dn, filenames in os.walk(PATH) for f in filenames if os.path.splitext(f)[1] == ".txt" ]</code>
Alternativ ist glob ein weiteres leistungsstarkes Tool, mit dem Dateien anhand ihrer Erweiterungen ausgewählt werden können. Hier ist ein Beispiel für die Verwendung von Glob:
<code class="python">import os from glob import glob result = [ y for x in os.walk(PATH) for y in glob(os.path.join(x[0], "*.txt")) ]</code>
Für Python 3.4 bietet Pathlib einen intuitiven Ansatz für diese Aufgabe:
<code class="python">from pathlib import Path result = list(Path(".").rglob("*.[tT][xX][tT]"))</code>
Das obige ist der detaillierte Inhalt vonWie kann ich mit Python effizient nach Dateien in Unterordnern suchen und diese auflisten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!