首页 > 后端开发 > Python教程 > 如何有效地合并多个具有重叠列的 Pandas DataFrame?

如何有效地合并多个具有重叠列的 Pandas DataFrame?

Susan Sarandon
发布: 2024-11-28 17:44:10
原创
481 人浏览过

How Can I Efficiently Merge Multiple Pandas DataFrames with Overlapping Columns?

在 Pandas 中使用三向连接组合多个数据帧

给定多个具有重叠人名作为第一列的 CSV 文件,任务是将这些文件合并到单个 CSV 中,每行包含唯一的所有属性person.

Pandas 中传统的 join() 函数需要分层索引。但是,可以使用另一种方法来简化加入过程。

用于数据帧合并的 Reduce 函数

合并数据帧的一种有效方法是使用 functools.reduce 函数以及 pd.merge 函数。代码如下所示:

import functools as ft
dfs = [df0, df1, df2, ..., dfN]
df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
登录后复制

这种方法允许将任意数量的数据帧与公共“名称”列合并。

以上是如何有效地合并多个具有重叠列的 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板