首页 > 后端开发 > Python教程 > 如何将函数应用于 Pandas DataFrame 中的多个列?

如何将函数应用于 Pandas DataFrame 中的多个列?

Susan Sarandon
发布: 2024-12-08 15:16:12
原创
541 人浏览过

How to Apply a Function to Multiple Columns in a Pandas DataFrame?

将函数应用于 Pandas Dataframe 的多列

假设我们在 Pandas Dataframe 中有一个包含多列的数据集,并且我们想要将自定义函数应用于其中两列。这可能是数据操作和分析中的常见任务。以下是实现此目标的分步指南:

1.定义函数:

定义一个接受两个输入的自定义函数,代表两列中的值。此函数应该对这些输入执行所需的操作。

2.使用 Lambda 应用函数:

Pandas 提供了一个 lambda 函数,允许我们将函数应用于数据帧的每一行。我们可以利用这一点将自定义函数应用到选定的列。

使用 lambda 将函数应用到多列的语法是:

df['new_column_name'] = df.apply(lambda x: your_function(x.column_1, x.column_2), axis=1)
登录后复制

其中:

  • new_column_name 是将存储函数结果的新列的名称。
  • your_function 是用户定义的函数,接受两个输入并返回所需的输出。
  • x 表示数据帧的每一行,x.column_1 和 x.column_2 访问指定列中的值。
  • axis=1 表示函数应用于每一行,而不是每一列。

3.示例:

考虑以下示例数据框:

df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]})
登录后复制

假设我们要创建一个名为“col_3”的新列,其中包含基于值的原始列表 mylist 的子列表在 col_1 和 col_2 中。我们可以定义一个函数 get_sublist 如下:

def get_sublist(sta, end):
    return ['a', 'b', 'c', 'd', 'e', 'f'][sta:end+1]
登录后复制

现在,我们可以使用 lambda 应用此函数:

df['col_3'] = df.apply(lambda x: get_sublist(x.col_1, x.col_2), axis=1)
登录后复制

这会在数据框中创建一个新列 'col_3'所需的子列表。

4.替代方案:

使用 lambda 是将函数应用于多个数据框列的简洁且通用的方法。但是,如果您更喜欢更明确的方式,还可以将 apply() 方法与采用 Series 作为输入的自定义函数结合使用。这种方法涉及定义一个函数,该函数采用表示一行的单个输入,然后根据需要操作该特定行。

以上是如何将函数应用于 Pandas DataFrame 中的多个列?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板