PythonExcel文件操作_openpyxl与pandas结合实例【教程】

2次阅读

最实用的组合是 openpyxl 负责样式、公式、合并单元格等排版,pandas专注 数据清洗 与分析;读取需 data_only=True 获取公式结果,写入须单元格级赋值以保留格式,新增 sheet 用 openpyxl 创建并逐行写入。

PythonExcel 文件操作_openpyxl 与 pandas 结合实例【教程】

openpyxl 读写 excel 格式细节(如样式、公式、合并单元格),再用 pandas 数据清洗 和分析,是最实用的组合方案。关键在于分工明确:pandas 负责“算”,openpyxl 负责“排版”。

读取带格式的 Excel 并转为 DataFrame

openpyxl 默认不解析公式值,只读原始公式 字符串;若要读计算结果,需启用 data_only=True。同时注意:它不自动跳过空行或识别表头,需手动指定范围。

  • load_workbook(filename, data_only=True) 打开文件,避免公式显示为 =SUM(A1:A10) 而不是实际数值
  • 通过 ws.iter_rows(min_row=2, max_row=100, values_only=True) 按行提取数据,values_only=True 返回纯值(忽略样式)
  • 把结果转成列表,再传给 pd.DataFrame(),并用第一行作列名:df = pd.DataFrame(data[1:], columns=data[0])

用 pandas 处理完数据,写回原工作表(保留格式)

直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是:用 openpyxl 定位目标区域,逐单元格赋值,其他格式不动。

  • 先用 load_workbook(filename, keep_vba=True, read_only=False) 打开(keep_vba 可选,若含宏)
  • 定位目标工作表:ws = wb['Sheet1'],再确定起始单元格,如 start_cell = ws['C5']
  • 遍历 DataFrame:for r_idx, row in enumerate(df.values, 1):,再嵌套列 循环for c_idx, value in enumerate(row, 1):,写入 ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)

在已有 Excel 中插入新 sheet 并写入 pandas 表格

适合生成报表时追加分析页,不影响原表结构和样式。

立即学习Python 免费学习笔记(深入)”;

  • wb.create_sheet(title='Analysis_2024') 新建 sheet
  • 获取新 sheet 对象 后,用 dataframe_to_rows(df, index=False, header=True) 将 DataFrame 转为可迭代行数据
  • 逐行写入:for r_idx, row in enumerate(rows, 1):,再 for c_idx, value in enumerate(row, 1):,最后 ws.cell(r_idx, c_idx, value)
  • 可顺手调整列宽:for col in ['A', 'B', 'C']: ws.column_dimensions[col].width = 12

处理合并单元格与空单元格的兼容写法

openpyxl 对合并单元格敏感——读取时只有左上角单元格有值,其余为 None;写入时若覆盖已合并区域,会自动取消合并。需提前检查。

  • 读取前检查合并区域:for merged_cell in ws.merged_cells.ranges:,记录范围,后续逻辑跳过非首单元格
  • 写入前解除合并(谨慎):ws.unmerge_cells('A1:C1'),写完再重新合并(如有必要)
  • 更稳妥的做法:用 ws.cell(……).value 写值后,对对应区域调用 ws.merge_cells('A1:C1')

不复杂但容易忽略。核心就三点:读用 data_only,写用单元格级赋值,增删 sheet 用 openpyxl 管理结构,pandas 只管数据流。

站长
版权声明:本站原创文章,由 站长 2025-12-23发表,共计1624字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
1a44ec70fbfb7ca70432d56d3e5ef742
text=ZqhQzanResources