Pandas에서 복잡한 데이터 재구성 작업에 직면했을 때 Melt 기능은 강력한 도구로 떠오릅니다. 여러 열이 포함된 넓은 형식의 데이터프레임을 더 적은 수의 열이 포함된 긴 형식으로 원활하게 변환합니다.
실제 시나리오에서는 재구성이 필요한 데이터프레임을 고려해 보세요.
df = pd.DataFrame([[2, 4, 7, 8, 1, 3, 2013], [9, 2, 4, 5, 5, 6, 2014]], columns=['Amy', 'Bob', 'Carl', 'Chris', 'Ben', 'Other', 'Year'])
Amy Bob Carl Chris Ben Other Year 0 2 4 7 8 1 3 2013 1 9 2 4 5 5 6 2014
이를 변환하려면 데이터프레임을 보다 구조화된 형식으로 변환하려면 Melt 기능을 사용할 수 있습니다.
m = pd.melt(df, id_vars=['Year'], var_name='Name')
이 작업은 다음을 생성합니다. dataframe:
Year Name value 0 2013 Amy 2 1 2014 Amy 9 2 2013 Bob 4 3 2014 Bob 2 4 2013 Carl 7 ...
그러나 원하는 출력에는 "Group"이라는 추가 열이 포함되어 있습니다. 이를 얻으려면 사전의 모양을 변경하세요.
d2 = {} for k, v in d.items(): for item in v: d2[item] = k
이제 데이터 프레임을 "그룹" 열로 업데이트할 수 있습니다.
m['Group'] = m['Name'].map(d2)
마지막으로 '이름'에서 '기타'를 이동하세요. 열을 '그룹' 열로:
mask = m['Name'] == 'Other' m.loc[mask, 'Name'] = '' m.loc[mask, 'Group'] = 'Other'
결과 데이터 프레임은 원하는 것과 완벽하게 일치합니다. 출력:
Year Name value Group 0 2013 Amy 2 A 1 2014 Amy 9 A 2 2013 Bob 4 B 3 2014 Bob 2 B 4 2013 Carl 7 C ...
이러한 방식으로 Pandas Melt 기능은 데이터 과학자에게 데이터 프레임 재구성을 위한 다양하고 효율적인 메커니즘을 제공하여 다양한 분석 및 시각화 목적을 위해 데이터를 쉽게 변환하고 재구성할 수 있도록 해줍니다.
위 내용은 Pandas의 Melt 기능은 어떻게 추가 열을 사용하여 넓은 데이터 프레임을 원하는 긴 형식으로 재구성할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!