Pandas에서 데이터를 긴 형식에서 넓은 형식으로 재구성: 종합 가이드
많은 데이터 세트는 처음에 긴 형식으로 저장되며, 여기서 각 행은 단일 관측치와 다중 변수는 열로 나열됩니다. 그러나 각 행이 두 개 이상의 변수 값의 고유한 조합에 해당하는 넓은 형식으로 데이터를 재구성해야 하는 경우가 많습니다.
문제: 긴 데이터에서 넓은 데이터로 변환 특히 Melt/Stack/Unstack 방법을 사용할 때 형식은 Pandas에서 번거로운 작업이 될 수 있습니다. 예를 들어, 다음과 같은 긴 형식 데이터 프레임을 고려해 보세요.
<code class="python">import pandas as pd data = pd.DataFrame({ 'Salesman': ['Knut', 'Knut', 'Knut', 'Steve'], 'Height': [6, 6, 6, 5], 'product': ['bat', 'ball', 'wand', 'pen'], 'price': [5, 1, 3, 2] })</code>
와이드 형식으로 재구성:
데이터를 와이드 형식으로 재구성하려면 Chris Albon의 해결책:
긴 데이터프레임 생성:
<code class="python">raw_data = { 'patient': [1, 1, 1, 2, 2], 'obs': [1, 2, 3, 1, 2], 'treatment': [0, 1, 0, 1, 0], 'score': [6252, 24243, 2345, 2342, 23525] } df = pd.DataFrame(raw_data, columns=['patient', 'obs', 'treatment', 'score'])</code>
넓게로 변경:
<code class="python">df.pivot(index='patient', columns='obs', values='score')</code>
이렇게 하면 원하는 와이드 형식 데이터 프레임:
<code class="python">obs 1 2 3 patient 1 6252.0 24243.0 2345.0 2 2342.0 23525.0 NaN</code>
위 내용은 Pandas에서 데이터를 긴 형식에서 넓은 형식으로 재구성하는 방법: 단계별 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!