GroupBy를 사용하여 동일한 열에서 여러 함수로 집계
Python의 pandas 라이브러리에서 GroupBy.agg() 함수는 편리한 방법을 제공합니다. 그룹화된 데이터에 집계 함수를 적용합니다. 그러나 동일한 열에 여러 함수를 적용하는 것이 까다로울 수 있다는 점은 주목할 가치가 있습니다.
처음에는 다음 구문을 사용하는 것이 직관적으로 보일 수 있습니다.
df.groupby("dummy").agg({"returns": f1, "returns": f2})
그러나 이 접근 방식은 다음과 같은 이유로 실패합니다. Python에서 허용되지 않는 키를 복제합니다. 대신, pandas는 이러한 집계를 수행하기 위한 여러 가지 방법을 제공합니다:
방법 1: 함수 목록
함수는 목록으로 전달될 수 있습니다:
df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
방법 2: 사전 함수
함수는 열 이름을 나타내는 키와 함수 목록을 나타내는 값을 사용하여 사전으로 전달될 수 있습니다.
df.groupby("dummy").agg({"returns": {"Mean": np.mean, "Sum": np.sum}})
방법 3: 최근 업데이트(as 2022-06-20)
최신 버전의 pandas에서는 다음 구문이 선호됩니다.
df.groupby('dummy').agg( Mean=('returns', np.mean), Sum=('returns', np.sum))
이 구문은 원활하게 작동할 뿐만 아니라 집계 함수 및 열 이름을 지정할 때 더 큰 명확성과 유연성을 제공합니다.
위 내용은 Pandas GroupBy를 사용하여 동일한 열에 여러 집계 함수를 어떻게 적용할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!