Kombinieren von Datums- und Zeitspalten in Pandas mit pd.to_datetime()
Bei der Arbeit mit Datums- und Zeitdaten in Pandas ist dies oft notwendig um separate Spalten in einem einzigen Datetime-Objekt zu kombinieren. Eine Möglichkeit, dies zu tun, ist die Verwendung der Funktion pd.to_datetime().
Problemstellung
Betrachten Sie einen Datenrahmen mit den Spalten „Datum“ und „Uhrzeit“. unten gezeigt:
1 2 3 4 5 6 7 8 9 10 11 |
|
Unser Ziel ist es, diese beiden Spalten in einer einzigen Spalte „Datum und Uhrzeit“ zu kombinieren.
Lösung mit String-Verkettung
Ein Ansatz besteht darin, die Spalten „Datum“ und „Uhrzeit“ als Zeichenfolgen zu verketten und die resultierende Zeichenfolge dann mit pd.to_datetime() in ein Datetime-Objekt umzuwandeln:
1 |
|
Dies konvertiert die verkettete Zeichenfolge in eine Reihe von Datetime-Objekten.
Lösung mit Formatparameter
Alternativ können Sie den Formatparameter von pd.to_datetime() verwenden, um das genaue Format der kombinierten Objekte anzugeben string:
1 |
|
Dieser Ansatz ist schneller als der vorherige, insbesondere beim Umgang mit großen Datenmengen.
Leistungsvergleich
Verwendung der % Mit dem Befehl %timeit magic können wir die Leistung beider Ansätze vergleichen:
1 2 3 4 5 |
|
Der zweite Ansatz mit dem Formatparameter ist bei großen Datensätzen deutlich schneller.
Das obige ist der detaillierte Inhalt vonWie kombiniere ich Datums- und Zeitspalten in Pandas effizient mit pd.to_datetime()?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!