重塑表格資料是資料分析中的一項基本任務。資料透視是一種在資料框中調換行和列的技術,對於建立資料透視表和從不同角度探索資料通常很有用。讓我們探索如何在強大的資料操作庫 Pandas 中執行此操作。
要旋轉資料框,主要使用 .pivot 方法。此方法需要多個參數:
例如,考慮以下資料框:
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
要旋轉此資料框以使「指標」列中的值成為新列,請使用以下命令代碼:
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
此操作將產生下列旋轉資料框:
Indicator 1 2 3 4 5 Country Year Angola 2005 6 13 10 11 5 2006 3 2 7 3 6
要將旋轉資料框轉換回平面表格,請使用.rename_axis 刪除指標軸和. reset_index將“國家”和“年份”轉換回正常列。
print(out.rename_axis(columns=None).reset_index())
這將產生原始資料框結構:
Country Year 1 2 3 4 5 0 Angola 2005 6 13 10 11 5 1 Angola 2006 3 2 7 3 6
如果您的資料包含重複的標籤組合(例如國家/地區、年份、指標),請使用.pivot_table 。此方法預設採用平均值。
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
這將輸出類似的旋轉資料幀,但具有重複組合的平均值。
有關更詳細的概述,請參閱 Pandas 使用者重塑和資料透視表指南。
以上是如何使用 Pandas 旋轉資料框?的詳細內容。更多資訊請關注PHP中文網其他相關文章!