mac地址由6组十六进制数组成,每组2字符,用冒号或连字符分隔,如00:1a:2b:3c:4d:5e或00-1a-2b-3c-4d-5e。1. 使用正则表达式匹配时,基本结构为([0-9a-fa-f]{2}[:-]){5}([0-9a-fa-f]{2});2. 为增强鲁棒性,推荐加上单词边界b和忽略大小写标志re.ignorecase;3. 若需支持windows格式如001a.2b3c.4d5e,可扩展为支持点号分隔的模式;4. 可通过函数封装实现灵活验证多种mac地址格式。
MAC地址由6组十六进制数组成,每组2个字符,通常用冒号(:)或连字符(-)分隔。例如:00:1A:2B:3C:4D:5E 或 00-1A-2B-3C-4D-5E。
要使用 python 正则表达式匹配 MAC 地址,关键在于准确描述这些格式特征。
基本结构:识别十六进制对和分隔符
MAC 地址的基本组成单位是两个十六进制字符(0-9、a-f、A-F),后面跟一个分隔符(通常是冒号或连字符),共五次,最后一组没有分隔符。
立即学习“Python免费学习笔记(深入)”;
正则片段示例:
([0-9A-Fa-f]{2}[:-]){5}([0-9A-Fa-f]{2})
说明:
- [0-9A-Fa-f]{2} 匹配两位十六进制数
- [:-] 表示冒号或连字符
- {5} 表示前一部分重复5次
- 最后再加上一组十六进制数完成整个地址匹配
这个模式可以匹配大部分标准格式的 MAC 地址。
支持多种格式:处理不同写法和边界情况
有时候 MAC 地址可能有不同大小写组合,或者出现在字符串中间,比如日志中。为了提高鲁棒性,建议:
- 使用不区分大小写的标志 re.IGNORECASE
- 加上单词边界 b 避免匹配到更长的字符串中的一部分
完整推荐模式:
b([0-9A-F]{2}[:-]){5}[0-9A-F]{2}b
加上标志:
import re pattern = re.compile(r'b([0-9A-F]{2}[:-]){5}[0-9A-F]{2}b', re.IGNORECASE)
这样就可以匹配:
- 00:1a:2b:3c:4d:5e
- 00-1A-2B-3C-4D-5E
- 001A.2B3C.4D5E(如果稍作调整支持点号)
扩展技巧:如何提取和验证多个格式?
有些系统(如 windows)显示 MAC 地址时会使用点号(.)分隔,如 001A.2B3C.4D5E。如果你也需要支持这种格式,可以把分隔符部分改为可选的多个字符:
b(?:[0-9A-F]{2}[:-]){5}[0-9A-F]{2}b|b(?:[0-9A-F]{4}.){2}[0-9A-F]{4}b
说明:
- 第一部分是冒号/连字符格式
- 第二部分是每四字符一点号的格式
- 用 | 表示“或”的关系
也可以用函数封装验证逻辑,比如:
def is_valid_mac(mac): pattern = re.compile(r""" ( (?:[0-9A-F]{2}[:-]){5}[0-9A-F]{2} )|( (?:[0-9A-F]{4}.){2}[0-9A-F]{4} ) """, re.IGNORECASE | re.VERBOSE) return bool(pattern.fullmatch(mac))
这样你就可以灵活判断各种格式的 MAC 地址了。
基本上就这些。正则写 MAC 地址不算复杂,但要注意边界、格式差异和大小写问题。