使用 Python xlwings 逐行插入数据到 Excel 文件-小浪学习网

使用 Python xlwings 逐行插入数据到 Excel 文件

本文旨在解决使用 python xlwings 库向 excel 文件中循环写入数据时，数据被覆盖而非逐行追加的问题。核心解决方案是引入一个动态行号变量，在每次成功写入数据后递增该变量，从而确保每次写入操作都定位到新的下一行。文章将详细阐述其实现原理、提供优化的代码示例，并强调关键的注意事项，帮助开发者高效、准确地管理Excel数据写入。

问题描述：循环写入数据覆盖而非追加

在使用 python 的 xlwings 库处理 excel 文件时，一个常见的需求是遍历某个数据集，并将符合条件的数据逐行写入到 excel 工作表中。然而，如果处理不当，开发者可能会遇到数据被反复覆盖，而非按预期追加到新行的问题。

原始代码示例如下：

import pandas as pd import xlwings as wx # 假设wx是xlwings的别名  # ... (文件加载部分，此处省略) # loadfile1 = pd.read_excel(File1) # loadfile2 = pd.read_excel(File2) # l = loadfile1.values.tolist() # m = loadfile2.values.tolist()  A = wx.Book(CompFile) # 打开目标Excel文件  for row in l:     if row in m:         print('passed')         sheet = A.sheets['Source']         sheet.range('A1').value = row # 每次循环都写入到 A1 单元格

上述代码的核心问题在于 sheet.range(‘A1’).value = row 这一行。无论循环执行多少次，它始终将数据写入到 A1 单元格。因此，每次迭代都会覆盖前一次写入的内容，最终只留下最后一条写入的数据。

解决方案：动态行号管理

为了实现逐行追加数据，我们需要一个机制来动态地确定每次写入操作的目标行。最直接有效的方法是引入一个行号变量，并在每次成功写入数据后将其递增。

核心原理

初始化行号： 在循环开始之前，设置一个起始行号变量（例如，row_number = 1 表示从第一行开始写入）。
动态单元格引用： 在循环内部，使用该行号变量结合列名（例如，’A’）来构建动态的单元格引用（例如，’A1′, ‘A2’, ‘A3’ 等）。Python 的 f-String 提供了简洁的字符串格式化能力，非常适合此场景。
递增行号： 每当一行数据被成功写入后，立即将行号变量加 1，为下一次写入操作准备新的目标行。

优化后的代码示例

以下是根据上述原理优化后的代码：

立即学习“Python免费学习笔记（深入）”；

import pandas as pd import xlwings as xw # 通常使用 xw 作为 xlwings 的别名  # 假设 File1, File2, CompFile 变量已定义 # loadfile1 = pd.read_excel(File1) # loadfile2 = pd.read_excel(File2)  # 将 DataFrame 转换为列表，便于逐行处理 l = loadfile1.values.tolist() m = loadfile2.values.tolist()  # 打开或创建目标 Excel 工作簿 # 注意：xw.Book() 可以打开现有文件，如果文件不存在，xlwings会尝试创建 A = xw.Book(CompFile)  # 获取目标工作表对象 # 将获取工作表的操作移到循环外部，避免重复查找，提高效率 sheet = A.sheets['Source']  # 初始化起始行号 # 如果希望从 Excel 的第一行开始写入，设置为 1 # 如果希望从其他行开始，例如从第 2 行开始写入，设置为 2 row_number = 1  # 遍历数据并逐行写入 for row_data in l: # 将变量名改为 row_data，避免与 xlwings 的 row 混淆     if row_data in m:         print(f'匹配到数据: {row_data}') # 打印匹配到的数据，更清晰          # 使用 f-string 构建动态单元格地址，例如 'A1', 'A2', 'A3' ...         # 注意：xlwings 写入列表时，会将其内容自动填充到对应的列         sheet.range(f'A{row_number}').value = row_data          # 写入成功后，递增行号，为下一次写入准备新行         row_number += 1  # 所有数据写入完成后，保存工作簿 # 这是非常关键的一步，否则修改不会被保存 A.save()  # 关闭工作簿（可选，如果不再需要操作该工作簿） # A.close()

注意事项

起始行号的设置： row_number = 1 表示从 Excel 的第一行开始写入。根据您的实际需求，可以将其设置为任何合法的起始行号。例如，如果希望跳过表头从第二行开始写入数据，则将 row_number 初始化为 2。
获取工作表对象： 将 sheet = A.sheets[‘Source’] 放在循环外部是最佳实践。在循环内部重复获取工作表对象会增加不必要的开销，尤其是在处理大量数据时。
保存工作簿： A.save() 是至关重要的一步。如果没有调用 save() 方法，所有对 Excel 文件的修改都将不会被持久化。
数据类型匹配： xlwings 会根据 Python 数据的类型自动将其转换为 Excel 中合适的格式。例如，Python 列表会被写入到一行中的多个单元格，而单个值则写入单个单元格。确保 row_data 的结构符合您希望写入 Excel 的方式。如果 row_data 是一个列表（如本例所示），它将横向填充从 A{row_number} 开始的单元格。
性能考虑： 对于非常大的数据集（例如数万行以上），逐行写入可能会相对较慢。在这种情况下，可以考虑收集所有需要写入的数据到一个列表中，然后使用 xlwings 的一次性写入多行或多列的功能（例如 sheet.range(‘A1’).value = list_of_lists）来提高效率。但对于数百到数千行的数据，逐行写入通常是可接受的。