> 백엔드 개발 > 파이썬 튜토리얼 > Pandas에서 여러 그룹으로 평균값을 계산하는 방법은 무엇입니까?

Pandas에서 여러 그룹으로 평균값을 계산하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-11-20 01:45:01
원래의
346명이 탐색했습니다.

How to Calculate Average Values with Multiple Groupings in Pandas?

여러 그룹화 및 평균을 사용한 그룹별 집계

Pandas에서는 여러 수준으로 그룹화된 데이터에 대해 집계를 수행하는 것이 일반적인 작업입니다. 다음 DataFrame을 고려하십시오.

   cluster  org      time
   1      a       8
   1      a       6
   2      h       34
   1      c       23
   2      d       74
   3      w       6 
로그인 후 복사

일반적인 작업은 "cluster" 및 "org"와 같은 여러 변수로 정의된 그룹별로 "time"과 같은 지정된 열의 평균을 계산하는 것입니다.

해결책 1: 클러스터 그룹에만 대한 평균

"클러스터"로만 그룹화된 "시간"의 평균을 계산하려면 다음 코드를 사용할 수 있습니다.

df.groupby(['cluster']).mean()
로그인 후 복사

결과:

              time
cluster
1        12.333333
2        54.000000
3         6.000000
로그인 후 복사

해결 방법 2: 그룹 조합의 평균

계산하려는 경우 "클러스터"와 "org"의 각 조합에 대해 "시간"의 평균을 사용할 수 있습니다.

df.groupby(['cluster', 'org']).mean()
로그인 후 복사

결과:

               time
cluster org
1       a    438886
        c        23
2       d      9874
        h        34
3       w         6
로그인 후 복사

해결책 3: 그룹화에 대한 중첩 평균

중첩 평균을 수행하려면 먼저 "클러스터"와 "org" 조합에 대한 평균을 구한 다음 "클러스터" 그룹에 대한 평균을 구하고 다음을 사용하세요.

(df.groupby(['cluster', 'org'], as_index=False).mean()
            .groupby('cluster')['time'].mean())
로그인 후 복사

결과:

cluster  mean(time)
1          15 #=((8 + 6) / 2 + 23) / 2
2          54 #=(74 + 34) / 2
3           6
로그인 후 복사

위 내용은 Pandas에서 여러 그룹으로 평균값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿