Pandas-Datenrahmen kombinieren: Auf einer gemeinsamen Spalte verbinden
Joiner ist eine wesentliche Operation zum Zusammenführen von Datenrahmen basierend auf gemeinsamen Attributen. Diese Frage untersucht das Problem der Kombination zweier Pandas-Datenrahmen: restaurant_ids_dataframe und restaurant_review_frame.
Der Benutzer versucht, die DataFrame.join()-Methode zu verwenden, um einen linken Join mithilfe der Spalte business_id durchzuführen. Aufgrund überlappender Spalten (business_id, Sterne und Typ) tritt jedoch ein Fehler auf. Um dieses Problem zu lösen, können wir stattdessen die Zusammenführungsfunktion verwenden:
<code class="python">import pandas as pd pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>
Der on-Parameter gibt den Feldnamen an, der für die Verknüpfung verwendet wird, während der how-Parameter den Verknüpfungstyp definiert (außen, innen, links oder rechts). ). In diesem Fall wird „outer“ für eine Vereinigung von Schlüsseln aus beiden Datenrahmen ausgewählt.
Beachten Sie, dass beide Datenrahmen eine Spalte mit dem Namen „Stars“ enthalten. Standardmäßig fügt der Zusammenführungsvorgang Suffixe an die Spaltennamen an (star_x und star_y). Um diese Suffixe anzupassen, können wir das Schlüsselwortargument „suffixes“ verwenden:
<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>
Mit dieser Änderung werden die Sternspalten in star_restaurant_id und star_restaurant_review umbenannt. Durch die Nutzung der Zusammenführungsfunktion und die entsprechende Konfiguration des Verbindungstyps und der Spaltensuffixe können wir die beiden Datenrahmen basierend auf ihrer gemeinsamen Spalte „business_id“ erfolgreich kombinieren.
Das obige ist der detaillierte Inhalt vonWie können Sie zwei Pandas-DataFrames mit überlappenden Spalten kombinieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!