그룹화된 집계 및 평균 계산 수행
클러스터, 조직 및 시간에 대한 데이터가 포함된 다음 DataFrame을 고려하세요.
cluster org time 0 a 8 1 a 6 2 h 34 3 c 23 4 d 74 5 w 6
목표는 각 클러스터 내 조직당 평균 시간을 계산하는 것입니다. 예상 결과는 다음과 같습니다.
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
이중 GroupBy 및 평균 계산을 사용한 솔루션:
이를 달성하려면 Pandas의 groupby 기능을 활용하세요.
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean() result = cluster_org_time.groupby('cluster')['time'].mean()
클러스터 그룹을 위한 대체 솔루션 평균:
클러스터 그룹의 평균만 계산하려면 ['cluster']별로 그룹화하고 평균()을 사용하여 평균을 계산하세요.
cluster_mean_time = df.groupby(['cluster']).mean()
추가 옵션 조직 및 평균 계산을 사용하는 GroupBy의 경우:
또는 ['cluster', 'org']별로 그룹화하고 평균을 직접 계산할 수 있습니다.
cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()
위 내용은 Pandas DataFrame의 각 클러스터 내 조직당 평균 시간을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!