'count(distinct)'를 사용하는 Pandas의 SQL 쿼리와 동일
SQL에서는 다음을 사용하여 열의 고유 값을 계산할 수 있습니다. '개수(고유)' 함수. 예를 들어, 연간 월별 고유 클라이언트 코드를 계산하려면:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
그룹화된 DataFrame에서 'nunique()' 메서드를 사용하여 Pandas에서 유사한 작업을 수행할 수 있습니다. 데이터를 'YEARMONTH' 열로 그룹화한 후 'CLIENTCODE' 열에서 'nunique()'를 호출하면 연간 월간 고유 클라이언트 수를 얻을 수 있습니다.
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
예 :
다음 열을 포함하는 DataFrame '테이블'을 고려하세요.
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
앞서 언급한 코드를 적용하면 다음 결과가 나옵니다.
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
이 출력은 예상과 일치합니다. 결과를 통해 각 연도별 순 고객 수를 확인할 수 있습니다.
위 내용은 \'nunique()\'를 사용하여 Pandas에서 SQL \'count(distinct)\'를 수행하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!