インデックスによるデータフレームのマージ
はじめに
データフレームのマージは、データ分析における一般的なタスクです複数のソースからの情報を組み合わせる。通常、マージは列を一致基準として使用して実行されます。ただし、インデックスに基づいてデータフレームを結合する必要がある場合があります。この記事では、その方法についてのガイダンスを提供します。
結合メソッドを使用したインデックスによるデータフレームの結合
インデックスによってデータフレームを結合するには、次の結合メソッドを使用できます。
<code class="python">pd.merge(df1, df2, left_index=True, right_index=True)</code>
<code class="python">df1.join(df2)</code>
<code class="python">pd.concat([df1, df2], axis=1)</code>
例
次のデータフレームを考えます:
<code class="python">df1 = pd.DataFrame({'a':range(6), 'b':[5,3,6,9,2,4]}, index=list('abcdef')) df2 = pd.DataFrame({'c':range(4), 'd':[10,20,30, 40]}, index=list('abhi'))</code>
デフォルトの内部結合:
<code class="python">df3 = pd.merge(df1, df2, left_index=True, right_index=True)</code>
出力:
a b c d a 0 5 0 10 b 1 3 1 20
デフォルトの左結合:
<code class="python">df4 = df1.join(df2)</code>
出力:
a b c d a 0 5 0.0 10.0 b 1 3 1.0 20.0 c 2 6 NaN NaN d 3 9 NaN NaN e 4 2 NaN NaN f 5 4 NaN NaN
デフォルトの外部結合:
<code class="python">df5 = pd.concat([df1, df2], axis=1)</code>
出力:
a b c d a 0.0 5.0 0.0 10.0 b 1.0 3.0 1.0 20.0 c 2.0 6.0 NaN NaN d 3.0 9.0 NaN NaN e 4.0 2.0 NaN NaN f 5.0 4.0 NaN NaN h NaN NaN 2.0 30.0 i NaN NaN 3.0 40.0
以上がインデックスに基づいてデータフレームをマージするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。