用平均值填充组中的缺失值
给你一个包含缺失值的 pandas DataFrame,你的目标是用由特定列定义的每个组的平均值。这个常见任务可以使用多种方法来解决。
使用 GroupBy 和 Transformation
有效的方法包括使用 groupby() 和 transform() 函数:
grouped = df.groupby('name') df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))
在此代码中,我们首先使用 groupby() 按“name”列对 DataFrame 进行分组。然后,我们使用 Transform() 在“值”列上应用 lambda 函数。此函数检查每个组并用该组的平均值填充缺失值。最终结果存储回原始“值”列中。
通过采用此技术,您可以通过使用从每个组的数据派生的有意义的值替换缺失值来有效地处理缺失值。
以上是如何使用组均值填充 Pandas DataFrame 中的缺失值?的详细内容。更多信息请关注PHP中文网其他相关文章!