Heim > Backend-Entwicklung > Python-Tutorial > Wie können Sie zwei Pandas-DataFrames mit überlappenden Spalten kombinieren?

Wie können Sie zwei Pandas-DataFrames mit überlappenden Spalten kombinieren?

Mary-Kate Olsen
Freigeben: 2024-10-24 19:07:29
Original
1023 Leute haben es durchsucht

How Can You Combine Two Pandas DataFrames with Overlapping Columns?

Pandas-Datenrahmen kombinieren: Auf einer gemeinsamen Spalte verbinden

Joiner ist eine wesentliche Operation zum Zusammenführen von Datenrahmen basierend auf gemeinsamen Attributen. Diese Frage untersucht das Problem der Kombination zweier Pandas-Datenrahmen: restaurant_ids_dataframe und restaurant_review_frame.

Der Benutzer versucht, die DataFrame.join()-Methode zu verwenden, um einen linken Join mithilfe der Spalte business_id durchzuführen. Aufgrund überlappender Spalten (business_id, Sterne und Typ) tritt jedoch ein Fehler auf. Um dieses Problem zu lösen, können wir stattdessen die Zusammenführungsfunktion verwenden:

<code class="python">import pandas as pd

pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>
Nach dem Login kopieren

Der on-Parameter gibt den Feldnamen an, der für die Verknüpfung verwendet wird, während der how-Parameter den Verknüpfungstyp definiert (außen, innen, links oder rechts). ). In diesem Fall wird „outer“ für eine Vereinigung von Schlüsseln aus beiden Datenrahmen ausgewählt.

Beachten Sie, dass beide Datenrahmen eine Spalte mit dem Namen „Stars“ enthalten. Standardmäßig fügt der Zusammenführungsvorgang Suffixe an die Spaltennamen an (star_x und star_y). Um diese Suffixe anzupassen, können wir das Schlüsselwortargument „suffixes“ verwenden:

<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>
Nach dem Login kopieren

Mit dieser Änderung werden die Sternspalten in star_restaurant_id und star_restaurant_review umbenannt. Durch die Nutzung der Zusammenführungsfunktion und die entsprechende Konfiguration des Verbindungstyps und der Spaltensuffixe können wir die beiden Datenrahmen basierend auf ihrer gemeinsamen Spalte „business_id“ erfolgreich kombinieren.

Das obige ist der detaillierte Inhalt vonWie können Sie zwei Pandas-DataFrames mit überlappenden Spalten kombinieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage