计算Python中的办公室工作时长

计算Python中的办公室工作时长

本文旨在提供一个使用python计算办公室工作时长的教程,该教程基于CSV数据,无需依赖pandas库。通过读取包含员工ID、进出类型和时间戳的数据,计算出每个员工在指定月份(例如二月)的工作时长,并以易于理解的格式输出结果。重点在于数据处理、时间计算和结果呈现,并提供代码示例和注意事项。

使用Python计算办公室工作时长

本教程将指导您如何使用Python计算办公室工作时长,数据来源于csv文件,且不依赖Pandas库。我们将读取包含员工ID、进出类型(in 或 out)以及时间戳的数据,并计算出每个员工在指定月份(例如二月)的工作时长。

1. 数据准备

首先,我们需要一个包含员工进出记录的CSV文件。以下是一个示例数据:

id,type,time 1,out,2023-01-01T08:01:28.000Z 1,in,2023-02-01T08:01:28.000Z 2,in,2023-02-01T09:04:16.000Z 2,out,2023-02-01T12:01:28.000Z 1,out,2023-02-01T13:34:15.000Z

将以上数据保存为data.csv文件

立即学习Python免费学习笔记(深入)”;

2. 代码实现

以下是计算办公室工作时长的Python代码:

import datetime import csv  date_format = '%Y-%m-%dT%H:%M:%S.%fZ' total_time = {} feb = datetime.datetime.strptime('2023-02', '%Y-%m').month   file_path = 'data.csv' with open(file_path, 'r') as f:     # 创建一个CSV读取器     csv_file = csv.DictReader(f)     list_of_dict = list(csv_file)   for d in list_of_dict:   w_id = d['id']   dt = datetime.datetime.strptime(d['time'], date_format).date()   d_time = datetime.datetime.strptime(d['time'], date_format)    if d_time.month == feb:      if not total_time.get(w_id):       total_time[w_id] = {"date": None,"last_in": None, "last_out": None, "work_hour_s": 0. , 'work_hour_string': '' }      update_time = total_time[w_id]     update_time['date'] = dt     if d['type'] == 'in':       update_time['last_in'] = d_time     if d['type'] == 'out':       update_time['last_out'] = d_time      if update_time['last_out'] and update_time['last_in']:       if update_time['last_out'] > update_time['last_in']:         work_hour_s = update_time['last_out'] - update_time['last_in']         update_time['work_hour_s'] += work_hour_s.seconds          up_time = int(update_time['work_hour_s'])         hours, remainder = divmod(up_time, 3600)         minutes, seconds = divmod(remainder, 60)          formatted_duration = f"{hours:02d}:{minutes:02d}:{seconds:02d}"         update_time['work_hour_string'] = formatted_duration  print(total_time)

3. 代码解释

  1. 导入必要的库: 导入datetime和csv库。
  2. 定义日期格式: 定义时间戳的格式date_format = ‘%Y-%m-%dT%H:%M:%S.%fZ’。
  3. 初始化数据结构: 使用字典total_time存储每个员工的工作时长。
  4. 读取CSV文件: 使用csv.DictReader读取CSV文件,并将数据存储在list_of_dict列表中。
  5. 循环遍历数据: 遍历list_of_dict,提取员工ID、日期和时间。
  6. 筛选指定月份的数据: 筛选出二月份的数据。
  7. 计算工作时长: 对于每个员工,记录最近一次的in和out时间,如果out时间晚于in时间,则计算工作时长,并将结果累加到total_time中。
  8. 格式化输出: 将工作时长格式化为HH:MM:SS的字符串

4. 运行结果

运行以上代码,将得到如下输出:

{'1': {'date': datetime.date(2023, 2, 1),   'last_in': datetime.datetime(2023, 2, 1, 8, 1, 28),   'last_out': datetime.datetime(2023, 2, 1, 13, 34, 15),   'work_hour_s': 19967.0,   'work_hour_string': '05:32:47'},  '2': {'date': datetime.date(2023, 2, 1),   'last_in': datetime.datetime(2023, 2, 1, 9, 4, 16),   'last_out': datetime.datetime(2023, 2, 1, 12, 1, 28),   'work_hour_s': 10632.0,   'work_hour_string': '02:57:12'}}

5. 注意事项

  • 数据顺序: 代码假设CSV文件中的数据是按照时间顺序排列的。如果数据不是按时间顺序排列的,则需要先进行排序。
  • 缺失数据: 代码没有处理缺失数据的情况,例如员工只有in记录而没有out记录。在实际应用中,需要根据具体情况进行处理。
  • 数据清洗: 实际数据可能包含错误或异常数据,例如时间戳格式错误。在计算工作时长之前,需要对数据进行清洗。
  • 时区问题: 如果时间戳包含时区信息,需要将其转换为统一的时区,以避免计算错误。

6. 总结

本文提供了一个使用Python计算办公室工作时长的示例代码,该代码不依赖Pandas库,可以直接应用于CSV数据。在实际应用中,需要根据具体情况进行调整和优化,例如处理缺失数据、清洗错误数据以及处理时区问题。通过本文的学习,您应该能够掌握如何使用Python计算办公室工作时长,并将其应用于实际工作中。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享