Pandas Group-By Sum을 사용하여 이름별 과일 총계 계산
그룹화 및 집계는 데이터 작업 시 필수적인 작업입니다. Pandas는 이러한 프로세스를 단순화하는 강력한 GroupBy 기능을 제공합니다.
각 이름이 구매한 총 과일 수를 계산하려는 다음 DataFrame을 고려하세요.
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
이를 달성하기 위해 우리는 GroupBy 함수를 사용하여 "이름"과 "이름"을 기준으로 DataFrame을 그룹화할 수 있습니다. "Fruit":
df.groupby(['Name', 'Fruit'])
그러나 이는 집계를 수행하지 않고 데이터만 그룹화합니다. 각 그룹의 "숫자" 합계를 계산하려면 sum()을 사용할 수 있습니다.
df.groupby(['Name', 'Fruit']).sum()
이렇게 하면 계층적 인덱스가 있는 새 DataFrame이 출력됩니다. 여기서 첫 번째 수준은 "이름"에 해당하고 두 번째 수준은 "과일"에 해당합니다. "숫자" 열에는 각 그룹의 합계가 포함됩니다.
Number Name Fruit Bob Apples 16 Grapes 35 Oranges 67 Mike Apples 9 Oranges 57 Steve Apples 10 Tom Grapes 87 Oranges 15 Tony Grapes 15 Oranges 1
이는 각 이름이 구매한 총 과일 수를 표시하여 원하는 결과를 제공합니다.
위 내용은 Pandas GroupBy를 사용하여 이름별로 총 과일 구매를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!