在 Pandas 中使用三向连接组合多个数据帧
给定多个具有重叠人名作为第一列的 CSV 文件,任务是将这些文件合并到单个 CSV 中,每行包含唯一的所有属性person.
Pandas 中传统的 join() 函数需要分层索引。但是,可以使用另一种方法来简化加入过程。
用于数据帧合并的 Reduce 函数
合并数据帧的一种有效方法是使用 functools.reduce 函数以及 pd.merge 函数。代码如下所示:
import functools as ft dfs = [df0, df1, df2, ..., dfN] df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
这种方法允许将任意数量的数据帧与公共“名称”列合并。
以上是如何有效地合并多个具有重叠列的 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!