本文旨在介绍如何使用 Pandas 库透视 DataFrame,并将现有列转换为二级列标题。通过 set_index()、unstack()、to_frame()、transpose() 和 swaplevel() 等函数,我们可以灵活地重塑 DataFrame 的结构,以满足特定的数据处理需求,例如为后续流程准备特定格式的数据。
Pandas 提供了强大的数据透视功能,可以根据数据的不同维度进行重塑。在某些情况下,我们需要将 DataFrame 的一列作为新的列标题,并且保留原有的列作为二级列标题,以便更好地组织和呈现数据。以下是如何使用 Pandas 实现这种透视效果的详细步骤。
1. 创建 DataFrame
首先,我们创建一个示例 DataFrame,模拟原始数据。
import pandas as pd data = {'Column 1': [1, 2, 3], 'Column 2': ['A', 'B', 'C'], 'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data) print(df)
2. 设置索引并取消堆叠 (Unstack)
使用 set_index() 函数将要作为新列标题的列设置为索引。然后,使用 unstack() 函数将索引转换为列。
new_df = df.set_index(["Column 2"]).unstack() print(new_df)
3. 转换为 DataFrame
unstack() 函数返回一个 Pandas Series 对象。为了方便后续操作,我们需要使用 to_frame() 函数将其转换为 DataFrame。
new_df = new_df.to_frame() print(new_df)
4. 转置并交换列级别
为了得到最终的期望格式,我们需要先对 DataFrame 进行转置(transpose),然后使用 swaplevel() 函数交换列的级别。
new_df = new_df.T.swaplevel(axis=1) print(new_df)
完整代码示例
import pandas as pd data = {'Column 1': [1, 2, 3], 'Column 2': ['A', 'B', 'C'], 'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data) new_df = df.set_index(["Column 2"]).unstack().to_frame().T.swaplevel(axis=1) print(new_df)
注意事项
总结
通过结合 set_index()、unstack()、to_frame()、transpose() 和 swaplevel() 等函数,我们可以灵活地透视 Pandas DataFrame,并将其转换为满足特定需求的格式。 这种方法对于处理需要特定数据结构的场景非常有用,例如为其他数据处理流程准备输入数据。掌握这些技巧可以显著提高数据处理的效率和灵活性。
以上就是Pandas DataFrame 透视技巧:将现有列转换为二级列标题的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 //m.sbmmt.com/ All Rights Reserved | php.cn | 湘ICP备2023035733号