Pandas DataFrame 透视技巧：将现有列转换为二级列标题-小浪学习网

Pandas DataFrame 透视技巧：将现有列转换为二级列标题

本文旨在介绍如何使用 pandas 库透视 DataFrame，并将现有列转换为二级列标题。通过 set_index()、unstack()、to_frame()、transpose() 和 swaplevel() 等函数，我们可以灵活地重塑 DataFrame 的结构，以满足特定的数据处理需求，例如为后续流程准备特定格式的数据。

Pandas 提供了强大的数据透视功能，可以根据数据的不同维度进行重塑。在某些情况下，我们需要将 DataFrame 的一列作为新的列标题，并且保留原有的列作为二级列标题，以便更好地组织和呈现数据。以下是如何使用 Pandas 实现这种透视效果的详细步骤。

1. 创建 DataFrame

首先，我们创建一个示例 DataFrame，模拟原始数据。

import pandas as pd  data = {'Column 1': [1, 2, 3],         'Column 2': ['A', 'B', 'C'],         'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data)  print(df)

2. 设置索引并取消堆叠 (Unstack)

使用 set_index() 函数将要作为新列标题的列设置为索引。然后，使用 unstack() 函数将索引转换为列。

new_df = df.set_index(["Column 2"]).unstack() print(new_df)

3. 转换为 DataFrame

unstack() 函数返回一个 Pandas Series 对象。为了方便后续操作，我们需要使用 to_frame() 函数将其转换为 DataFrame。

new_df = new_df.to_frame() print(new_df)

4. 转置并交换列级别

为了得到最终的期望格式，我们需要先对 DataFrame 进行转置（transpose），然后使用 swaplevel() 函数交换列的级别。

new_df = new_df.T.swaplevel(axis=1) print(new_df)

完整代码示例

import pandas as pd  data = {'Column 1': [1, 2, 3],         'Column 2': ['A', 'B', 'C'],         'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data)  new_df = df.set_index(["Column 2"]).unstack().to_frame().T.swaplevel(axis=1)  print(new_df)

注意事项

确保要设置为索引的列具有唯一值，否则 unstack() 函数可能会产生意想不到的结果。
根据实际情况，可能需要调整 swaplevel() 函数中的 axis 参数，以正确交换列级别。
在数据量较大的情况下，可以考虑使用 pivot_table() 函数，它提供了更灵活的透视选项。

总结

通过结合 set_index()、unstack()、to_frame()、transpose() 和 swaplevel() 等函数，我们可以灵活地透视 Pandas DataFrame，并将其转换为满足特定需求的格式。这种方法对于处理需要特定数据结构的场景非常有用，例如为其他数据处理流程准备输入数据。掌握这些技巧可以显著提高数据处理的效率和灵活性。

文章版权归作者所有，未经允许请勿转载。

THE END

后端开发
# 对象 # 数据结构 # 堆 # pandas