Python的 os 模块怎么用?常见文件操作有哪些?

python的os模块是与操作系统交互的核心工具,它提供了一系列函数用于执行文件和目录操作。常见功能包括:1.获取当前工作目录(os.getcwd());2.更改工作目录(os.chdir());3.创建目录(os.mkdir(), os.makedirs());4.删除目录(os.rmdir(), os.removedirs());5.列出目录内容(os.listdir());6.重命名文件或目录(os.rename());7.删除文件(os.remove());8.检查路径是否存在(os.path.exists());9.拼接路径(os.path.join());10.判断路径类型(os.path.isfile(), os.path.isdir())。为避免路径注入攻击,应使用绝对路径、规范化路径、验证路径合法性并避免直接拼接用户输入。此外,os.walk()可用于递归遍历目录树,并根据文件类型、大小或修改时间执行操作。处理跨平台路径问题时,应使用os.path模块的相关函数确保路径兼容性。

Python的 os 模块怎么用?常见文件操作有哪些?

python的os模块是与操作系统交互的桥梁,它允许你执行文件和目录操作,运行系统命令等等。 简单来说,它让你用Python代码来管理你的电脑文件系统。

Python的 os 模块怎么用?常见文件操作有哪些?

解决方案

os模块的核心在于提供了一系列函数,用于执行与操作系统相关的任务。下面是一些常见的文件操作,以及如何使用os模块来实现它们:

Python的 os 模块怎么用?常见文件操作有哪些?

  1. 获取当前工作目录:

    立即学习Python免费学习笔记(深入)”;

    这就像知道你当前在哪个文件夹里。

    Python的 os 模块怎么用?常见文件操作有哪些?

    import os current_directory = os.getcwd() print(f"当前工作目录:{current_directory}")
  2. 更改当前工作目录:

    相当于切换到另一个文件夹。

    import os os.chdir("/path/to/your/directory") # 替换成你想要切换的目录 print(f"当前工作目录:{os.getcwd()}")
  3. 创建目录:

    创建一个新的文件夹。

    import os os.mkdir("new_directory") # 创建一个名为"new_directory"的目录 # 或者创建多层目录 os.makedirs("new_directory/sub_directory")
  4. 删除目录:

    删除一个文件夹。需要注意的是,文件夹必须为空才能删除。

    import os os.rmdir("new_directory") # 删除名为"new_directory"的目录 # 删除多层目录 os.removedirs("new_directory/sub_directory") # 从最底层开始逐层删除
  5. 列出目录中的文件:

    查看文件夹里有哪些文件和子文件夹。

    import os files = os.listdir(".") # 列出当前目录下的所有文件和目录 print(f"当前目录下的文件:{files}")
  6. 重命名文件或目录:

    给文件或文件夹改个名字。

    import os os.rename("old_name.txt", "new_name.txt") # 将"old_name.txt"重命名为"new_name.txt"
  7. 删除文件:

    删除一个文件。

    import os os.remove("file_to_delete.txt") # 删除名为"file_to_delete.txt"的文件
  8. 检查文件或目录是否存在:

    确认某个文件或文件夹是否存在。

    import os if os.path.exists("my_file.txt"):     print("文件存在") else:     print("文件不存在")
  9. 拼接路径:

    把几个路径片段组合成一个完整的路径。这在跨平台开发时非常有用,因为不同操作系统的路径分隔符可能不同。

    import os path = os.path.join("/home", "user", "documents", "my_file.txt") print(f"拼接后的路径:{path}")
  10. 判断是否是文件/目录:

    import os path = "my_file.txt" if os.path.isfile(path):     print("这是一个文件") if os.path.isdir(path):     print("这是一个目录")

如何安全地处理文件路径,避免路径注入攻击?

路径注入攻击是指攻击者通过操纵文件路径,使得程序访问到预期之外的文件或目录,从而导致安全漏洞。 要避免这种攻击,关键在于验证和清理用户提供的任何文件路径。

  • 使用绝对路径: 尽量使用绝对路径,避免使用相对路径。可以通过os.path.abspath()函数将相对路径转换为绝对路径。
  • 路径规范化: 使用os.path.normpath()函数规范化路径,它可以移除多余的分隔符、.和..,从而简化路径。
  • 路径验证: 验证用户提供的路径是否在允许的范围内。可以使用os.path.commonpath()函数检查路径是否在指定的根目录下。
  • 避免直接拼接用户输入: 尽量避免直接将用户输入拼接到文件路径中。如果必须拼接,请确保对用户输入进行严格的验证和过滤。

例如:

import os  def secure_file_Access(base_dir, user_input):     # 1. 拼接路径     file_path = os.path.join(base_dir, user_input)      # 2. 规范化路径     normalized_path = os.path.normpath(file_path)      # 3. 获取绝对路径     abs_path = os.path.abspath(normalized_path)      # 4. 验证路径是否在允许的根目录下     if not abs_path.startswith(base_dir):         raise ValueError("Unauthorized access attempt!")      # 现在可以安全地访问文件     with open(abs_path, 'r') as f:         return f.read()  # 示例用法 base_dir = "/safe/directory" # 你的安全目录 user_input = "data.txt" # 用户提供的文件名  try:     content = secure_file_access(base_dir, user_input)     print(content) except ValueError as e:     print(e)

os.walk() 的高级用法:遍历目录树并执行复杂操作

os.walk() 是一个非常强大的函数,它可以递归地遍历目录树,并为每个目录返回一个三元组:(dirpath, dirnames, filenames),分别表示当前目录的路径、子目录名列表和文件名列表。

除了基本用法之外,os.walk() 还可以用于执行更复杂的操作,例如:

  • 根据文件类型执行不同的操作:

    import os for dirpath, dirnames, filenames in os.walk("."):     for filename in filenames:         if filename.endswith(".txt"):             print(f"处理文本文件: {os.path.join(dirpath, filename)}")         elif filename.endswith(".jpg"):             print(f"处理图片文件: {os.path.join(dirpath, filename)}")
  • 跳过特定的目录:

    import os for dirpath, dirnames, filenames in os.walk("."):     if "node_modules" in dirpath:         continue # 跳过 node_modules 目录     print(f"当前目录: {dirpath}")
  • 修改目录列表,从而影响遍历行为:

    import os for dirpath, dirnames, filenames in os.walk("."):     if "secret" in dirnames:         dirnames.remove("secret") # 阻止 os.walk 进入 "secret" 目录     print(f"当前目录: {dirpath}")
  • 查找特定大小或修改日期的文件:

    import os import time for dirpath, dirnames, filenames in os.walk("."):     for filename in filenames:         filepath = os.path.join(dirpath, filename)         file_size = os.path.getsize(filepath)         modification_time = os.path.getmtime(filepath)         if file_size > 1024 * 1024: # 大于 1MB             print(f"大文件: {filepath}")         if time.time() - modification_time < 86400: # 24 小时内修改过             print(f"最近修改的文件: {filepath}")

如何处理跨平台的文件路径问题?

不同的操作系统使用不同的路径分隔符(例如,windows 使用 ,而 linuxmacos 使用 /)。 为了编写跨平台的代码,需要使用 os.path 模块来处理文件路径。

  • 使用 os.path.join() 拼接路径: os.path.join() 会根据当前操作系统自动选择正确的路径分隔符。
  • 使用 os.path.abspath() 获取绝对路径: 绝对路径是与平台无关的。
  • 使用 os.path.normpath() 规范化路径: 它可以将平台相关的路径转换为规范化的形式。
  • 使用 os.path.split() 分割路径: 它可以将路径分割成目录和文件名两部分。

例如:

import os  # 拼接路径 path = os.path.join("folder", "subfolder", "file.txt") print(f"拼接后的路径: {path}")  # 获取绝对路径 abs_path = os.path.abspath(path) print(f"绝对路径: {abs_path}")  # 规范化路径 norm_path = os.path.normpath("//folder//subfolder/../file.txt") print(f"规范化后的路径: {norm_path}")  # 分割路径 dirname, filename = os.path.split(path) print(f"目录: {dirname}, 文件名: {filename}")

这些技巧可以帮助你编写更健壮、更可移植的Python代码,以便在不同的操作系统上运行。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享