Pandas での 'count(distinct)' を使用した同等の SQL クエリ
SQL では、列内の個別の値をカウントするには、 「count(distinct)」関数。たとえば、年月ごとに一意のクライアント コードをカウントするには:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
同様の操作を、グループ化された DataFrame で 'nunique()' メソッドを使用して Pandas で実行できます。データを「YEARMONTH」列でグループ化し、「CLIENTCODE」列で「nunique()」を呼び出すことで、年月ごとの一意のクライアント数を取得できます。
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
例:
次の列を含む DataFrame 'table' を考えます:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
前述のコードを適用すると次の結果が得られます:
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
この出力は予想されるものと一致します結果として、年月ごとのユニーク クライアントの数が表示されます。
以上が「nunique()」を使用して Pandas で同等の SQL「count(distinct)」を実行する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。