ホームページ > バックエンド開発 > Python チュートリアル > Pandas で ID とグループごとに用語の出現を効率的にカウントするにはどうすればよいですか?

Pandas で ID とグループごとに用語の出現を効率的にカウントするにはどうすればよいですか?

Barbara Streisand
リリース: 2024-12-25 19:27:14
オリジナル
907 人が閲覧しました

How to Efficiently Count Term Occurrences by ID and Group in Pandas?

Pandas の Groupby を使用した ID とグループによる用語数の取得

問題

ID (id)、group (group) の列を含む DataFrame が与えられた場合)、用語 (用語) の目標は、ID と用語の一意の組み合わせごとに各用語の出現を効率的にカウントすることです。 group.

解決策

Pandas の強力な groupby 関数と size 関数を利用すると、ループに頼ることなくこれを達成できます。

結果

これ操作により、用語を表す階層的な MultiIndex DataFrame が生成されます。カウント:


グループ term1 term2 term3
id
1 3 2 02 2 1 1

パフォーマンス分析

何百万行もの大規模なデータセットであっても、このベクトル化されたアプローチは優れたパフォーマンスを示します。

以上がPandas で ID とグループごとに用語の出現を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート