Pandas DataFrame 透视技巧：保留现有列作为第二层列标题-小浪学习网

Pandas DataFrame 透视技巧：保留现有列作为第二层列标题

本文旨在介绍如何使用 pandas 库透视 DataFrame，并将现有列转换为第二层列标题，从而满足特定数据格式的需求。通过 unstack 函数、DataFrame 转换和层级交换等操作，实现将 DataFrame 按照指定列进行透视，并保留原有列信息作为新的列标题的一部分，为后续数据处理或导入其他系统提供便利。

在数据分析和处理过程中，经常需要对 DataFrame 进行透视操作，以便更好地组织和分析数据。有时候，我们需要将 DataFrame 中的某一列作为新的列标题，同时保留原有的列信息。本文将介绍如何使用 Pandas 库实现这一目标，将现有列转换为第二层列标题，从而满足特定的数据格式需求。

使用 unstack 函数进行透视

Pandas 提供了 unstack 函数，可以将 DataFrame 的某一列转换为列索引，从而实现透视的效果。首先，我们需要将需要作为列标题的列设置为索引。然后，调用 unstack 函数，将索引转换为列。

以下是一个示例：

import pandas as pd  # 创建示例 DataFrame data = {'column 1': [1, 2, 3],         'Column 2': ['A', 'B', 'C'],         'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data)  # 将 'Column 2' 设置为索引 new_df = df.set_index(["Column 2"])  # 使用 unstack 函数进行透视 new_df = new_df.unstack()  print(new_df)

这段代码首先创建了一个 DataFrame，然后使用 set_index 函数将 ‘Column 2’ 设置为索引。接着，使用 unstack 函数将索引转换为列。此时，new_df 是一个 Series 对象，而不是 DataFrame 对象。

将 Series 转换为 DataFrame

unstack 函数的输出是一个 Series 对象，我们需要将其转换为 DataFrame 对象，才能进行后续的操作。可以使用 to_frame 函数将 Series 转换为 DataFrame。

new_df = new_df.to_frame() print(new_df)

调整列层级

为了得到最终想要的格式，我们需要对 DataFrame 的列层级进行调整。首先，我们需要对 DataFrame 进行转置，然后交换列的层级。

new_df = new_df.T.swaplevel(axis=1) print(new_df)

这段代码首先使用 T 属性对 DataFrame 进行转置，然后使用 swaplevel 函数交换列的层级。axis=1 参数指定交换列的层级。

完整代码示例

下面是完整的代码示例：

import pandas as pd  # 创建示例 DataFrame data = {'Column 1': [1, 2, 3],         'Column 2': ['A', 'B', 'C'],         'Column 3': ['a', 'b', 'c']} df = pd.DataFrame(data)  # 将 'Column 2' 设置为索引 new_df = df.set_index(["Column 2"]).unstack()  # 将 Series 转换为 DataFrame new_df = new_df.to_frame()  # 调整列层级 new_df = new_df.T.swaplevel(axis=1)  print(new_df)