本文旨在提供一个使用python计算办公室工作时长的教程,该教程基于CSV数据,无需依赖pandas库。通过读取包含员工ID、进出类型和时间戳的数据,计算出每个员工在指定月份(例如二月)的工作时长,并以易于理解的格式输出结果。重点在于数据处理、时间计算和结果呈现,并提供代码示例和注意事项。
使用Python计算办公室工作时长
本教程将指导您如何使用Python计算办公室工作时长,数据来源于csv文件,且不依赖Pandas库。我们将读取包含员工ID、进出类型(in 或 out)以及时间戳的数据,并计算出每个员工在指定月份(例如二月)的工作时长。
1. 数据准备
首先,我们需要一个包含员工进出记录的CSV文件。以下是一个示例数据:
id,type,time 1,out,2023-01-01T08:01:28.000Z 1,in,2023-02-01T08:01:28.000Z 2,in,2023-02-01T09:04:16.000Z 2,out,2023-02-01T12:01:28.000Z 1,out,2023-02-01T13:34:15.000Z
将以上数据保存为data.csv文件。
立即学习“Python免费学习笔记(深入)”;
2. 代码实现
以下是计算办公室工作时长的Python代码:
import datetime import csv date_format = '%Y-%m-%dT%H:%M:%S.%fZ' total_time = {} feb = datetime.datetime.strptime('2023-02', '%Y-%m').month file_path = 'data.csv' with open(file_path, 'r') as f: # 创建一个CSV读取器 csv_file = csv.DictReader(f) list_of_dict = list(csv_file) for d in list_of_dict: w_id = d['id'] dt = datetime.datetime.strptime(d['time'], date_format).date() d_time = datetime.datetime.strptime(d['time'], date_format) if d_time.month == feb: if not total_time.get(w_id): total_time[w_id] = {"date": None,"last_in": None, "last_out": None, "work_hour_s": 0. , 'work_hour_string': '' } update_time = total_time[w_id] update_time['date'] = dt if d['type'] == 'in': update_time['last_in'] = d_time if d['type'] == 'out': update_time['last_out'] = d_time if update_time['last_out'] and update_time['last_in']: if update_time['last_out'] > update_time['last_in']: work_hour_s = update_time['last_out'] - update_time['last_in'] update_time['work_hour_s'] += work_hour_s.seconds up_time = int(update_time['work_hour_s']) hours, remainder = divmod(up_time, 3600) minutes, seconds = divmod(remainder, 60) formatted_duration = f"{hours:02d}:{minutes:02d}:{seconds:02d}" update_time['work_hour_string'] = formatted_duration print(total_time)
3. 代码解释
- 导入必要的库: 导入datetime和csv库。
- 定义日期格式: 定义时间戳的格式date_format = ‘%Y-%m-%dT%H:%M:%S.%fZ’。
- 初始化数据结构: 使用字典total_time存储每个员工的工作时长。
- 读取CSV文件: 使用csv.DictReader读取CSV文件,并将数据存储在list_of_dict列表中。
- 循环遍历数据: 遍历list_of_dict,提取员工ID、日期和时间。
- 筛选指定月份的数据: 筛选出二月份的数据。
- 计算工作时长: 对于每个员工,记录最近一次的in和out时间,如果out时间晚于in时间,则计算工作时长,并将结果累加到total_time中。
- 格式化输出: 将工作时长格式化为HH:MM:SS的字符串。
4. 运行结果
运行以上代码,将得到如下输出:
{'1': {'date': datetime.date(2023, 2, 1), 'last_in': datetime.datetime(2023, 2, 1, 8, 1, 28), 'last_out': datetime.datetime(2023, 2, 1, 13, 34, 15), 'work_hour_s': 19967.0, 'work_hour_string': '05:32:47'}, '2': {'date': datetime.date(2023, 2, 1), 'last_in': datetime.datetime(2023, 2, 1, 9, 4, 16), 'last_out': datetime.datetime(2023, 2, 1, 12, 1, 28), 'work_hour_s': 10632.0, 'work_hour_string': '02:57:12'}}
5. 注意事项
- 数据顺序: 代码假设CSV文件中的数据是按照时间顺序排列的。如果数据不是按时间顺序排列的,则需要先进行排序。
- 缺失数据: 代码没有处理缺失数据的情况,例如员工只有in记录而没有out记录。在实际应用中,需要根据具体情况进行处理。
- 数据清洗: 实际数据可能包含错误或异常数据,例如时间戳格式错误。在计算工作时长之前,需要对数据进行清洗。
- 时区问题: 如果时间戳包含时区信息,需要将其转换为统一的时区,以避免计算错误。
6. 总结
本文提供了一个使用Python计算办公室工作时长的示例代码,该代码不依赖Pandas库,可以直接应用于CSV数据。在实际应用中,需要根据具体情况进行调整和优化,例如处理缺失数据、清洗错误数据以及处理时区问题。通过本文的学习,您应该能够掌握如何使用Python计算办公室工作时长,并将其应用于实际工作中。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END