首頁 > 後端開發 > Python教學 > 如何使用 Pandas 旋轉資料框?

如何使用 Pandas 旋轉資料框?

Patricia Arquette
發布: 2024-11-21 02:10:14
原創
177 人瀏覽過

How to Pivot a Dataframe Using Pandas?

如何使用 Pandas 透視資料框

重塑表格資料是資料分析中的一項基本任務。資料透視是一種在資料框中調換行和列的技術,對於建立資料透視表和從不同角度探索資料通常很有用。讓我們探索如何在強大的資料操作庫 Pandas 中執行此操作。

要旋轉資料框,主要使用 .pivot 方法。此方法需要多個參數:

  1. index:指定要成為透視資料幀索引的欄位。
  2. :指示要成為透視表的列標題的列dataframe.
  3. values:表示應使用其值填充資料透視表的列。

例如,考慮以下資料框:

Indicator  Country  Year  Value
1          Angola   2005  6
2          Angola   2005  13
3          Angola   2005  10
4          Angola   2005  11
5          Angola   2005  5
1          Angola   2006  3
2          Angola   2006  2
3          Angola   2006  7
4          Angola   2006  3
5          Angola   2006  6
登入後複製

要旋轉此資料框以使「指標」列中的值成為新列,請使用以下命令代碼:

out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value')
print(out)
登入後複製

此操作將產生下列旋轉資料框:

Indicator     1   2   3   4  5
Country Year
Angola  2005  6  13  10  11  5
        2006  3   2   7   3  6
登入後複製

要將旋轉資料框轉換回平面表格,請使用.rename_axis 刪除指標軸和. reset_index將“國家”和“年份”轉換回正常列。

print(out.rename_axis(columns=None).reset_index())
登入後複製

這將產生原始資料框結構:

  Country  Year  1   2   3   4  5
0  Angola  2005  6  13  10  11  5
1  Angola  2006  3   2   7   3  6
登入後複製

如果您的資料包含重複的標籤組合(例如國家/地區、年份、指標),請使用.pivot_table 。此方法預設採用平均值。

out = df.pivot_table(
    index=['Country', 'Year'],
    columns='Indicator',
    values='Value')
print(out.rename_axis(columns=None).reset_index())
登入後複製

這將輸出類似的旋轉資料幀,但具有重複組合的平均值。

有關更詳細的概述,請參閱 Pandas 使用者重塑和資料透視表指南。

以上是如何使用 Pandas 旋轉資料框?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板