コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Pandas DataFrame 内のグループ内の用語の出現を効率的にカウントするにはどうすればよいですか?

Pandas DataFrame 内のグループ内の用語の出現を効率的にカウントするにはどうすればよいですか?

Linda Hamilton

リリース： 2024-12-12 17:11:14

オリジナル

638 人が閲覧しました

How to Efficiently Count Term Occurrences within Groups in a Pandas DataFrame?

Pandas データフレーム内の用語数によるグループ化

問題:

次のデータフレームが与えられたとします。次の列: id、group、および term。目標は、ID とグループの一意の組み合わせごとに各用語の出現数を判断することです。

解決策:

ループの使用を避けるには、groupby とPandas のサイズ関数:

groupby 関数は、指定された列 (id、group、および一方、size 関数は各組み合わせの出現をカウントします。 unstack 関数は、カウントが行列状に配置された、より視覚的に魅力的なテーブルを生成します。

結果は、最初の 2 つのレベルが ID とグループの組み合わせを表し、3 番目のレベルが複数のインデックス列を含むテーブルになります。という用語に相当します。テーブルの各セルには、対応する ID とグループに対して特定の用語が出現する回数が表示されます。

タイミング:

大規模なデータセットの場合 (例: 1,000,000 行) 、パフォーマンスは優れています:

前述のアプローチを使用すると、経過時間は約1秒です。

以上がPandas DataFrame 内のグループ内の用語の出現を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース：php.cn

前の記事：複数のデータベースに接続し、SQL クエリを作成または生成し、分析または視覚化します。次の記事：Python CType で DLL をロードすると OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありませんがスローされるのはなぜですか?

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

最新の問題

function_exists() はカスタム関数を決定できません Function test () {return true;} if (function_exists ('test')) {echo "テストは関数です";

から 2024-04-29 11:01:01

0

3

2176

Google Chromeのモバイル版を表示する方法こんにちは、先生、Google Chrome をモバイル版に変更するにはどうすればよいですか?

から 2024-04-23 00:22:19

0

11

2327

子ウィンドウは親ウィンドウを操作しますが、出力は応答しません。最初の 2 つの文は実行可能ですが、最後の文は実装できません。

から 2024-04-19 15:37:47

0

1

1958

親ウィンドウには出力がありません document.onclick = function(){ window.opener.document.write('私は子ウィンドウの出力です');

から 2024-04-18 23:52:34

0

1

1841

CSS マインドマッピングに関するコースウェアはどこにありますか? コースウェア

から 2024-04-16 10:10:18

0

0

1890

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート