Pandas Transform을 사용하여 GroupBy DataFrame에 열 추가
Pandas에서 groupby 작업을 수행할 때 결과 데이터프레임. 이를 수행하는 한 가지 방법은 예제에서 설명한 대로 .map() 함수를 사용하는 것입니다. 그러나 보다 간단한 대안은 .transform() 함수를 사용하는 것입니다.
.transform()을 사용하면 데이터 프레임의 각 그룹에 함수를 적용하고 결과와 함께 시리즈를 반환할 수 있습니다. 반환된 시리즈에는 원본 데이터 프레임에 맞춰 정렬된 인덱스가 있습니다.
설명을 위해 제공된 데이터 프레임부터 시작해 보겠습니다.
df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
우리의 목표는 각 c에 대한 유형 값을 계산하는 것입니다. 그리고 c 크기의 열을 추가합니다.
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
이 코드는 각 그룹의 값을 계산하고 t라는 새 열을 생성합니다.
.transform( ), 다음을 수행할 수 있습니다.
g['size'] = df.groupby('c')['type'].transform('size')
.transform('size')는 각 그룹에 크기 함수를 적용하여 각 그룹의 크기를 반환합니다. 결과 시리즈는 원본 데이터 프레임의 인덱스와 정렬되어 g에 새 열로 추가할 수 있습니다.
출력은 size라는 추가 열이 있는 데이터 프레임이 됩니다.
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
.transform()을 사용하면 그룹별 집계에서 원래 데이터 프레임에 열을 다시 추가하는 더 간결하고 간단한 방법이 제공됩니다.
위 내용은 GroupBy DataFrames에서 Pandas Transform을 사용하여 열을 추가하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!