> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?

Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-11-14 20:49:02
원래의
363명이 탐색했습니다.

How to Calculate the Average Time per Organization Within Each Cluster in a Pandas DataFrame?

그룹화된 집계 및 평균 계산 수행

클러스터, 조직 및 시간에 대한 데이터가 포함된 다음 DataFrame을 고려하세요.

  cluster org  time
0       a    8
1       a    6
2       h   34
3       c   23
4       d   74
5       w    6
로그인 후 복사

목표는 각 클러스터 내 조직당 평균 시간을 계산하는 것입니다. 예상 결과는 다음과 같습니다.

cluster  mean(time)
1        15 #=((8 + 6) / 2 + 23) / 2
2        54 #=(74 + 34) / 2
3        6
로그인 후 복사

이중 GroupBy 및 평균 계산을 사용한 솔루션:

이를 달성하려면 Pandas의 groupby 기능을 활용하세요.

  1. 초기 GroupBy: groupby(['cluster', 'org'])를 사용하여 'cluster'와 'org'로 데이터를 그룹화합니다.
  2. 중간 집계: 평균()을 사용하여 각 그룹 내의 시간 평균을 계산합니다.
  3. 2차 GroupBy: groupby('cluster'를 사용하여 결과 DataFrame을 'cluster'별로 추가 그룹화합니다. ).
  4. 최종 집계: 평균()을 사용하여 각 클러스터의 평균 시간을 계산합니다.
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean()
result = cluster_org_time.groupby('cluster')['time'].mean()
로그인 후 복사

클러스터 그룹을 위한 대체 솔루션 평균:

클러스터 그룹의 평균만 계산하려면 ['cluster']별로 그룹화하고 평균()을 사용하여 평균을 계산하세요.

cluster_mean_time = df.groupby(['cluster']).mean()
로그인 후 복사

추가 옵션 조직 및 평균 계산을 사용하는 GroupBy의 경우:

또는 ['cluster', 'org']별로 그룹화하고 평균을 직접 계산할 수 있습니다.

cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()
로그인 후 복사

위 내용은 Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿