データフレーム列内の値の頻度をカウントする
カテゴリ値を含む列を持つデータフレームを指定すると、頻度をカウントする必要が生じる場合があります。各一意の値の出現頻度を調べます。
次の点を考慮してください。 dataframe:
category cat a cat b cat a
個別の値とそれに対応する頻度を取得するには、次の手順に従います。
value_counts() を使用する
@DSM、これを達成するには value_counts() を利用してくださいtask:
In [37]: df = pd.DataFrame({'a':list('abssbab')}) df['a'].value_counts()
Output:
b 3 a 2 s 2 dtype: int64
groupby() と count() を使用する
または、 groupby() を使用できます。 count():
In [38]: df.groupby('a').count()
出力:
a a a 2 b 3 s 2 [3 rows x 1 columns]
追加オプション:
詳細については、を参照してください。パンダのドキュメントへhttps://pandas.pydata.org.
周波数をデータフレームに戻す
周波数値を元のデータフレームに追加し直す場合は、次のことができます。でtransform()を利用しますcount():
In [41]: df['freq'] = df.groupby('a')['a'].transform('count') df
出力:
a freq 0 a 2 1 b 3 2 s 2 3 s 2 4 b 3 5 a 2 6 b 3 [7 rows x 2 columns]
以上がPandas DataFrame 列の値の頻度をカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。