ホームページ > バックエンド開発 > Python チュートリアル > Pandas データをグループ化し、出現回数をカウントし、最大数を見つけるにはどうすればよいですか?

Pandas データをグループ化し、出現回数をカウントし、最大数を見つけるにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-10-23 13:40:02
オリジナル
785 人が閲覧しました

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas データのグループ化数と最大数の取得

問題:

Pandas データフレームが指定された場合複数の列がある場合、2 つの特定の列ごとに行を効率的にグループ化し、各グループの数を取得するにはどうすればよいでしょうか?さらに、グループ化列の 1 つの各値の最大数はどのように決定しますか?

解決策:

DataFrame 行を 2 つの列でグループ化し、出現回数をカウントするには、groupby() 関数の後に size() メソッドを使用します。

<code class="python">df.groupby(['col5', 'col2']).size()</code>
ログイン後にコピー

この操作は、指定された列に基づいてグループを作成し、各グループの行数を返します。出力は次のようになります:

col5  col2  count
1     A       1
      D       3
2     B       2
...
ログイン後にコピー

col2 列の各値の最大カウントを見つけるには:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
ログイン後にコピー

この操作は、col2 列レベルでカウント データをグループ化し、各 Col2 値の最大カウントを返し、次のような出力を生成します。

col2
A       3
B       2
C       1
D       3
ログイン後にコピー

追加メモ:

複数の列でグループ化し、カウントと追加の概要統計を取得するには、groupby() を agg() などの他のメソッドと組み合わせて使用​​すると、複数の集計関数を指定できます:

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
ログイン後にコピー

以上がPandas データをグループ化し、出現回数をカウントし、最大数を見つけるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート