Pandas GroupBy を使用して合計を計算する方法
データ サイエンスでは、多くの場合、洞察を得るためにデータを集計する必要があります。一般的な集計手法の 1 つは、グループ内の値を合計することです。 Python ライブラリ Pandas は、データをグループ化し、合計などのさまざまな操作を実行するための汎用性の高い GroupBy 関数を提供します。
次の DataFrame について考えます:
Fruit | Date | Name | Number |
---|---|---|---|
Apples | 10/6/2016 | Bob | 7 |
Apples | 10/6/2016 | Bob | 8 |
Apples | 10/6/2016 | Mike | 9 |
Apples | 10/7/2016 | Steve | 10 |
Apples | 10/7/2016 | Bob | 1 |
Oranges | 10/7/2016 | Bob | 2 |
Oranges | 10/6/2016 | Tom | 15 |
Oranges | 10/6/2016 | Mike | 57 |
Oranges | 10/6/2016 | Bob | 65 |
Oranges | 10/7/2016 | Tony | 1 |
Grapes | 10/7/2016 | Bob | 1 |
Grapes | 10/7/2016 | Tom | 87 |
Grapes | 10/7/2016 | Bob | 22 |
Grapes | 10/7/2016 | Bob | 12 |
Grapes | 10/7/2016 | Tony | 15 |
それぞれが購入したフルーツの総数を取得するには名前を指定するには、GroupBy.sum() メソッドを使用します。
df.groupby(['Name', 'Fruit']).sum()
これにより、次のものが生成されます。出力:
Fruit | Name | Number |
---|---|---|
Apples | Bob | 16 |
Apples | Mike | 9 |
Apples | Steve | 10 |
Grapes | Bob | 35 |
Grapes | Tom | 87 |
Grapes | Tony | 15 |
Oranges | Bob | 67 |
Oranges | Mike | 57 |
Oranges | Tom | 15 |
Oranges | Tony | 1 |
以上がPandas GroupBy を使用してグループ内の値を合計するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。