Pandas에서 그룹화된 DataFrame에 열 추가
Pandas에서 데이터 프레임으로 작업할 때 데이터를 그룹화하고 해당 데이터 프레임 내에서 값을 집계해야 하는 경우가 많습니다. 여러 떼. 일반적으로 여기에는 집계 결과가 포함된 별도의 데이터 프레임을 만드는 작업이 포함됩니다. 그러나 이러한 집계된 열을 원본 데이터 프레임에 직접 추가하는 것도 유용할 수 있습니다.
간단한 데이터 프레임 예를 통해 이를 설명하겠습니다.
<code class="python">df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})</code>
'type' 값을 계산하려면 각 'c' 값에 대해 다음 코드를 사용할 수 있습니다.
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
이렇게 하면 'c', 'type', 't'라는 세 개의 열이 있는 새 데이터프레임 'g'가 생성됩니다. 각 'c' 내의 각 '유형' 수를 계산합니다.
다음으로 'size()' 메서드를 사용하여 각 그룹의 행 수를 계산할 수 있습니다.
<code class="python">a = df.groupby('c').size().reset_index(name='size')</code>
이것은 각 'c' 그룹의 행 수를 포함하는 'c'와 'size'라는 두 개의 열이 있는 새 데이터 프레임 'a'를 생성합니다.
원본 데이터 프레임에 'size' 열을 추가하려면 한 가지 옵션 질문에 표시된 대로 'map()' 함수를 사용하는 것입니다. 그러나 보다 간단한 접근 방식은 'transform()' 메서드를 사용하는 것입니다.
<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
'transform()' 메서드는 원래 데이터 프레임에 맞춰 인덱스가 정렬된 Series를 반환합니다. 이 시리즈를 그룹화된 데이터 프레임의 새 열에 할당함으로써 집계된 값을 원래 데이터 프레임에 다시 효과적으로 추가합니다.
이제 결과 데이터 프레임 'g'에는 추가 '크기' 열이 포함됩니다.
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
이 접근 방식은 Pandas의 그룹화된 데이터 프레임에 집계 열을 추가하는 간단하고 효율적인 방법을 제공합니다.
위 내용은 Pandas의 그룹화된 DataFrame에 집계 열을 추가하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!