Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?-파이썬 튜토리얼-php.cn

Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?

Susan Sarandon

풀어 주다： 2024-11-14 20:49:02

원래의

363명이 탐색했습니다.

How to Calculate the Average Time per Organization Within Each Cluster in a Pandas DataFrame?

그룹화된 집계 및 평균 계산 수행

클러스터, 조직 및 시간에 대한 데이터가 포함된 다음 DataFrame을 고려하세요.

  cluster org  time
0       a    8
1       a    6
2       h   34
3       c   23
4       d   74
5       w    6

로그인 후 복사

목표는 각 클러스터 내 조직당 평균 시간을 계산하는 것입니다. 예상 결과는 다음과 같습니다.

cluster  mean(time)
1        15 #=((8 + 6) / 2 + 23) / 2
2        54 #=(74 + 34) / 2
3        6

로그인 후 복사

이중 GroupBy 및 평균 계산을 사용한 솔루션:

이를 달성하려면 Pandas의 groupby 기능을 활용하세요.

초기 GroupBy: groupby(['cluster', 'org'])를 사용하여 'cluster'와 'org'로 데이터를 그룹화합니다.
중간 집계: 평균()을 사용하여 각 그룹 내의 시간 평균을 계산합니다.
2차 GroupBy: groupby('cluster'를 사용하여 결과 DataFrame을 'cluster'별로 추가 그룹화합니다. ).
최종 집계: 평균()을 사용하여 각 클러스터의 평균 시간을 계산합니다.

cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean()
result = cluster_org_time.groupby('cluster')['time'].mean()

로그인 후 복사

클러스터 그룹을 위한 대체 솔루션 평균:

클러스터 그룹의 평균만 계산하려면 ['cluster']별로 그룹화하고 평균()을 사용하여 평균을 계산하세요.

cluster_mean_time = df.groupby(['cluster']).mean()

로그인 후 복사

추가 옵션 조직 및 평균 계산을 사용하는 GroupBy의 경우:

또는 ['cluster', 'org']별로 그룹화하고 평균을 직접 계산할 수 있습니다.

cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()

로그인 후 복사

위 내용은 Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!