在Pandas 中將資料從長變為寬:綜合指南
許多資料集最初以長格式存儲,其中每一行代表一個單一觀察值和多個變數列為列。然而,通常有必要將資料重塑為寬格式,其中每一行對應於兩個或多個變數值的唯一組合。
問題:將資料從長格式轉換為寬格式在 Pandas 中格式化可能是一項繁瑣的任務,特別是在使用熔化/堆疊/取消堆疊方法時。例如,考慮以下長格式資料框:
<code class="python">import pandas as pd data = pd.DataFrame({ 'Salesman': ['Knut', 'Knut', 'Knut', 'Steve'], 'Height': [6, 6, 6, 5], 'product': ['bat', 'ball', 'wand', 'pen'], 'price': [5, 1, 3, 2] })</code>
重塑為寬格式:
要將資料重塑為寬格式,我們可以利用Chris Albon的解:
建立長資料框:
<code class="python">raw_data = { 'patient': [1, 1, 1, 2, 2], 'obs': [1, 2, 3, 1, 2], 'treatment': [0, 1, 0, 1, 0], 'score': [6252, 24243, 2345, 2342, 23525] } df = pd.DataFrame(raw_data, columns=['patient', 'obs', 'treatment', 'score'])</code>
重塑為寬:
<code class="python">df.pivot(index='patient', columns='obs', values='score')</code>
重塑為寬:
<code class="python">obs 1 2 3 patient 1 6252.0 24243.0 2345.0 2 2342.0 23525.0 NaN</code>
以上是如何在 Pandas 中將資料從長格式重塑為寬格式:逐步指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!