Pandas の groupby 操作は、データ分析のための強力なツールを提供し、ユーザーが 1 つ以上の列に基づいてデータを集計および操作できるようにします。データ分析における一般的な操作は、特定の条件に基づいて groupby 操作の結果をフィルター処理することです。これは SQL の HAVING 句に相当します。
Pandas でこの機能を実装するには、filter メソッドとラムダ関数を組み合わせて使用できます。ラムダ関数は各グループのブール条件を評価し、条件が True の場合、グループは保持されます。 groupby オブジェクトをフィルタリングするための構文は次のとおりです:
<code>df.groupby('group_column').filter(lambda x: condition)</code>
たとえば、特定の列の合計が特定の値より大きいすべてのグループを検索するには、次のコードを使用できます:
<code>df.groupby('group_column').filter(lambda x: x['column'].sum() > value)</code>
この操作は、条件付き集計、外れ値の削除、複雑な条件に基づくデータのフィルタリングに特に役立ちます。これは、グループ化されたデータに対して複雑なフィルタリング操作を実行するための簡潔かつ効率的な方法を提供します。
以上がPandas を使用して SQL の GROUP BY HAVING 句の機能を実現するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。