Heim > Backend-Entwicklung > Python-Tutorial > Was ist der effizienteste Weg, einen Pandas-DataFrame zu erstellen?

Was ist der effizienteste Weg, einen Pandas-DataFrame zu erstellen?

Susan Sarandon
Freigeben: 2024-11-27 16:49:11
Original
799 Leute haben es durchsucht

What's the Most Efficient Way to Create a Pandas DataFrame?

Leere DataFrames erstellen: Ein Vergleich der Ansätze

Die traditionelle Methode, einen leeren Pandas-DataFrame zu erstellen und ihn schrittweise zu füllen, kann ineffizient und speicherintensiv sein -intensiv. Ein optimalerer Ansatz besteht darin, Daten in einer Liste zu sammeln und sie bei Bedarf in einen DataFrame umzuwandeln.

Vorteile der Listenakkumulation:

  • Speichereffizienz: Listen sind leichte Datenstrukturen, die im Vergleich zu weniger Speicher verbrauchen DataFrames.
  • Leistung: Das Anhängen an eine Liste ist deutlich schneller als das wiederholte Anhängen an einen DataFrame.
  • Automatische Datentypinferenz: Wenn die Liste in einen DataFrame konvertiert wird, ermittelt Pandas automatisch die entsprechenden Datentypen.
  • Automatischer Index Erstellung:Ein RangeIndex wird automatisch für die Daten erstellt, sodass keine manuelle Indexzuweisung erforderlich ist.

Beispielcode für die Listenakkumulation:

data = []
for row in some_function_that_yields_data():
    data.append(row)

df = pd.DataFrame(data)
Nach dem Login kopieren

Vorsichtsmaßnahmen für Vermeiden Sie:

  • Iteratives Anhängen an einen DataFrame: Vermeiden Sie aus Leistungsgründen die Verwendung von df.append oder pd.concat innerhalb einer Schleife. Dieser Ansatz führt zu Operationen mit quadratischer Komplexität.
  • Verwendung von loc innerhalb einer Schleife: Das Anhängen mit df.loc[len(df)] führt auch zu einer ineffizienten Speicherzuweisung.
  • Leerer DataFrame aus NaNs: Durch das Erstellen eines mit NaNs gefüllten DataFrame können Objektspalten entstehen, die behindern können Leistung.

Benchmark-Ergebnisse:

Benchmark-Ergebnisse zeigen, dass die Listenakkumulation deutlich schneller erfolgt als die herkömmliche Methode des iterativen Anhängens. Je größer der DataFrame wird, desto ausgeprägter wird der Zeitunterschied.

Das obige ist der detaillierte Inhalt vonWas ist der effizienteste Weg, einen Pandas-DataFrame zu erstellen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage