使用 Python xlwings 在 Excel 中逐行插入数据

使用 Python xlwings 在 Excel 中逐行插入数据

本教程详细介绍了如何使用 python 的 xlwings 库将数据逐行插入到 excel 工作表中,而非重复覆盖同一单元格。核心方法是引入一个行号计数器,每次成功写入数据后递增,从而确保新数据被写入到下一行。文章提供了示例代码和最佳实践,帮助用户高效自动化数据写入任务,避免常见的数据覆盖问题,并提升脚本性能。

理解数据覆盖问题

在使用 xlwings 等库向 Excel 写入数据时,一个常见的问题是数据会被重复覆盖,而不是追加到新的行。这通常发生在代码逻辑中,每次迭代都将数据写入到相同的单元格引用(例如 A1)。

原始代码片段可能如下所示:

import pandas as pd import xlwings as xw # 假设 wx 实际上是 xlwings  # 假设 File1, File2, CompFile 已经定义 loadfile1 = pd.read_excel(File1) loadfile2 = pd.read_excel(File2)  l = loadfile1.values.tolist() m = loadfile2.values.tolist()  A = xw.Book(CompFile) # 打开目标工作簿  for row_data in l:     if row_data in m:         print('passed')         # 问题所在:每次循环都获取 'Source' 工作表对象,并写入到固定的 'A1' 单元格         sheet = A.sheets['Source']         sheet.range('A1').value = row_data

在这段代码中,sheet.range(‘A1’).value = row_data 是导致数据覆盖的根本原因。无论循环执行多少次,它总是尝试将当前 row_data 写入到 Source 工作表的 A1 单元格中,从而覆盖了上一次循环写入的数据。

解决方案:动态行号管理

要实现逐行插入数据,我们需要引入一个机制来动态地改变写入的行号。最直接有效的方法是使用一个变量作为行计数器,并在每次成功写入数据后将其递增。

立即学习Python免费学习笔记(深入)”;

核心思路:

  1. 初始化行号: 在循环开始之前,定义一个变量(例如 row_number)并将其初始化为目标起始行号(通常是 1,代表 Excel 的第一行)。
  2. 动态单元格引用: 在循环内部,使用该行号变量来构建动态的单元格引用。例如,如果需要写入 A 列,可以使用 f-String 格式化字符串 f’A{row_number}’ 来生成 A1, A2, A3 等。
  3. 递增行号: 每次成功将数据写入一行后,将 row_number 递增 1,以便下一次写入时指向下一行。

优化与实现

除了动态行号管理,我们还可以对代码进行一些优化,以提高效率和可读性。

  1. 将 Sheet 对象移到循环外部: 在原始代码中,sheet = A.sheets[‘Source’] 在每次循环中都被执行。获取工作表对象是一个相对耗时的操作,将其移到循环外部可以显著提高脚本的执行效率,因为它只需要被获取一次。
  2. 保存工作簿: 完成所有数据写入后,务必调用 A.save() 方法来保存对工作簿的更改,否则所有写入操作将不会被持久化。

结合这些改进,修正后的代码示例如下:

import pandas as pd import xlwings as xw # 确保导入 xlwings  # 假设 File1, File2, CompFile 已经定义并指向有效路径 File1 = 'your_file1.xlsx' # 替换为你的文件路径 File2 = 'your_file2.xlsx' # 替换为你的文件路径 CompFile = 'your_comparison_output.xlsx' # 替换为你的输出文件路径  try:     loadfile1 = pd.read_excel(File1)     loadfile2 = pd.read_excel(File2)      l = loadfile1.values.tolist()     m = loadfile2.values.tolist()      A = xw.Book(CompFile) # 打开目标工作簿     sheet = A.sheets['Source'] # 将 Sheet 对象移到循环外部,提高效率      # 初始化行号。从第1行开始写入,如果需要从其他行开始,请修改此值。     row_number = 1      print("开始处理数据并写入Excel...")     for row_data in l:         # 假设 row_data 是一个列表,xlwings 会将其写入一行         if row_data in m:             print(f'匹配到数据: {row_data},写入到第 {row_number} 行')             # 使用 f-string 动态构建单元格引用,例如 'A1', 'A2', 'A3' ...             # 如果 row_data 是一个列表,xlwings 会将其内容写入从 'A' 列开始的对应单元格             sheet.range(f'A{row_number}').value = row_data             row_number += 1  # 每次成功写入一行后,行号递增      A.save()  # 保存对工作簿的更改     A.close() # 关闭工作簿     print("数据写入完成并已保存。")  except FileNotFoundError as e:     print(f"错误:文件未找到 - {e}") except Exception as e:     print(f"发生未知错误:{e}") 

注意事项与最佳实践

  • 起始行号: row_number = 1 表示从 Excel 的第一行开始写入。如果你的数据需要从特定的行(例如,跳过标题行,从第二行开始)写入,你可以将 row_number 初始化为 2 或其他相应的值。
  • 数据类型 xlwings 在处理列表数据时非常灵活。如果你将一个列表赋值给 range(‘A1’).value,xlwings 会自动将列表中的每个元素写入到从 A1 开始的相应列中。例如,sheet.range(‘A1’).value = [‘Value1’, ‘Value2’, ‘Value3’] 会将 ‘Value1′ 写入 A1,’Value2′ 写入 B1,’Value3’ 写入 C1。
  • 错误处理: 在实际应用中,建议添加 try-except 块来处理文件不存在、Excel 应用程序未运行等潜在错误,提高脚本的健壮性。
  • 性能考量: 对于非常大的数据集,逐行写入可能会比较慢。在这种情况下,可以考虑收集所有要写入的数据到一个大的列表中,然后使用 sheet.range(‘A1’).value = all_data_list 一次性写入。xlwings 能够高效地处理二维列表的写入。
  • 保存与关闭: 务必在所有操作完成后调用 A.save() 保存工作簿,并在不再需要时调用 A.close() 关闭工作簿,释放资源。

通过采用动态行号管理和上述优化措施,你可以有效地使用 Python 和 xlwings 实现 Excel 数据的逐行插入,从而自动化复杂的数据处理任务。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享