Pandas のサイズとカウントの区別を理解する
データ操作と分析のための強力な Python ライブラリである Pandas は、次のような柔軟な操作を提供します。カテゴリごとにデータをグループ化します。グループ化されたデータを操作する場合、count メソッドと size メソッドの違いを理解することが重要です。
質問: Pandas で groupby("x").count と groupby("x").size を分けるものは何ですか? ?サイズは単に null を除外するだけですか?
答え:
カウントとサイズの違いは、NaN 値の処理にあります:
例:
次のパンダについて考えてみましょうDataFrame:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
'a' でグループ化された 'b' 列の count メソッドと size メソッドを評価します:
print(df.groupby(['a'])['b'].count()) print(df.groupby(['a'])['b'].size())
Output:
a 0 2 1 1 2 2 Name: b, dtype: int64 a 0 2 1 1 2 3 dtype: int64
明らかなように、count メソッドではグループ 4 の NaN 値が除外されます (ここで、 'a' は 2) ですが、size メソッドにはそれが含まれます。
以上がPandas の `groupby().count()` と `groupby().size()` の違いは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。