グループ内の欠損値を平均値で埋める
欠損値を持つ pandas DataFrame が与えられ、これらの値を特定の列で定義された各グループの平均。この一般的なタスクは、さまざまな方法を使用して解決できます。
GroupBy と Transformation の使用
効果的なアプローチには、groupby() 関数とtransform() 関数の使用が含まれます。
grouped = df.groupby('name') df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))
このコードでは、最初に groupby() を使用して「name」列で DataFrame をグループ化します。次に、transform() を使用して「value」列にラムダ関数を適用します。この関数は各グループを検査し、欠損値をそのグループの平均値で埋めます。最終結果は、元の「値」列に格納されます。
この手法を採用すると、欠損値を各グループのデータから得られた意味のある値に置き換えることで、欠損値を効率的に処理できます。
以上がグループ平均を使用して Pandas DataFrame の欠損値を埋める方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。