使用 Python xlwings 在 Excel 中逐行插入数据-小浪学习网

使用 Python xlwings 在 Excel 中逐行插入数据

本教程详细介绍了如何使用 python 的 xlwings 库将数据逐行插入到 excel 工作表中，而非重复覆盖同一单元格。核心方法是引入一个行号计数器，每次成功写入数据后递增，从而确保新数据被写入到下一行。文章提供了示例代码和最佳实践，帮助用户高效自动化数据写入任务，避免常见的数据覆盖问题，并提升脚本性能。

理解数据覆盖问题

在使用 xlwings 等库向 Excel 写入数据时，一个常见的问题是数据会被重复覆盖，而不是追加到新的行。这通常发生在代码逻辑中，每次迭代都将数据写入到相同的单元格引用（例如 A1）。

原始代码片段可能如下所示：

import pandas as pd import xlwings as xw # 假设 wx 实际上是 xlwings  # 假设 File1, File2, CompFile 已经定义 loadfile1 = pd.read_excel(File1) loadfile2 = pd.read_excel(File2)  l = loadfile1.values.tolist() m = loadfile2.values.tolist()  A = xw.Book(CompFile) # 打开目标工作簿  for row_data in l:     if row_data in m:         print('passed')         # 问题所在：每次循环都获取 'Source' 工作表对象，并写入到固定的 'A1' 单元格         sheet = A.sheets['Source']         sheet.range('A1').value = row_data

在这段代码中，sheet.range(‘A1’).value = row_data 是导致数据覆盖的根本原因。无论循环执行多少次，它总是尝试将当前 row_data 写入到 Source 工作表的 A1 单元格中，从而覆盖了上一次循环写入的数据。

解决方案：动态行号管理

要实现逐行插入数据，我们需要引入一个机制来动态地改变写入的行号。最直接有效的方法是使用一个变量作为行计数器，并在每次成功写入数据后将其递增。

立即学习“Python免费学习笔记（深入）”；

核心思路：

初始化行号： 在循环开始之前，定义一个变量（例如 row_number）并将其初始化为目标起始行号（通常是 1，代表 Excel 的第一行）。
动态单元格引用： 在循环内部，使用该行号变量来构建动态的单元格引用。例如，如果需要写入 A 列，可以使用 f-String 格式化字符串 f’A{row_number}’ 来生成 A1, A2, A3 等。
递增行号： 每次成功将数据写入一行后，将 row_number 递增 1，以便下一次写入时指向下一行。

优化与实现

除了动态行号管理，我们还可以对代码进行一些优化，以提高效率和可读性。

将 Sheet 对象移到循环外部： 在原始代码中，sheet = A.sheets[‘Source’] 在每次循环中都被执行。获取工作表对象是一个相对耗时的操作，将其移到循环外部可以显著提高脚本的执行效率，因为它只需要被获取一次。
保存工作簿： 完成所有数据写入后，务必调用 A.save() 方法来保存对工作簿的更改，否则所有写入操作将不会被持久化。

结合这些改进，修正后的代码示例如下：

import pandas as pd import xlwings as xw # 确保导入 xlwings  # 假设 File1, File2, CompFile 已经定义并指向有效路径 File1 = 'your_file1.xlsx' # 替换为你的文件路径 File2 = 'your_file2.xlsx' # 替换为你的文件路径 CompFile = 'your_comparison_output.xlsx' # 替换为你的输出文件路径  try:     loadfile1 = pd.read_excel(File1)     loadfile2 = pd.read_excel(File2)      l = loadfile1.values.tolist()     m = loadfile2.values.tolist()      A = xw.Book(CompFile) # 打开目标工作簿     sheet = A.sheets['Source'] # 将 Sheet 对象移到循环外部，提高效率      # 初始化行号。从第1行开始写入，如果需要从其他行开始，请修改此值。     row_number = 1      print("开始处理数据并写入Excel...")     for row_data in l:         # 假设 row_data 是一个列表，xlwings 会将其写入一行         if row_data in m:             print(f'匹配到数据: {row_data}，写入到第 {row_number} 行')             # 使用 f-string 动态构建单元格引用，例如 'A1', 'A2', 'A3' ...             # 如果 row_data 是一个列表，xlwings 会将其内容写入从 'A' 列开始的对应单元格             sheet.range(f'A{row_number}').value = row_data             row_number += 1  # 每次成功写入一行后，行号递增      A.save()  # 保存对工作簿的更改     A.close() # 关闭工作簿     print("数据写入完成并已保存。")  except FileNotFoundError as e:     print(f"错误：文件未找到 - {e}") except Exception as e:     print(f"发生未知错误：{e}")

注意事项与最佳实践

起始行号： row_number = 1 表示从 Excel 的第一行开始写入。如果你的数据需要从特定的行（例如，跳过标题行，从第二行开始）写入，你可以将 row_number 初始化为 2 或其他相应的值。
数据类型： xlwings 在处理列表数据时非常灵活。如果你将一个列表赋值给 range(‘A1’).value，xlwings 会自动将列表中的每个元素写入到从 A1 开始的相应列中。例如，sheet.range(‘A1’).value = [‘Value1’, ‘Value2’, ‘Value3’] 会将 ‘Value1′ 写入 A1，’Value2′ 写入 B1，’Value3’ 写入 C1。
错误处理： 在实际应用中，建议添加 try-except 块来处理文件不存在、Excel 应用程序未运行等潜在错误，提高脚本的健壮性。
性能考量： 对于非常大的数据集，逐行写入可能会比较慢。在这种情况下，可以考虑收集所有要写入的数据到一个大的列表中，然后使用 sheet.range(‘A1’).value = all_data_list 一次性写入。xlwings 能够高效地处理二维列表的写入。
保存与关闭： 务必在所有操作完成后调用 A.save() 保存工作簿，并在不再需要时调用 A.close() 关闭工作簿，释放资源。