本文介绍了使用正则表达式匹配四种常见ip地址格式的方法。1. ipv4地址由四组0到255之间的数字组成,每组用点分隔,例如192.168.1.1,其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b;2. 带子网掩码的ipv4地址在ipv4基础上加了一个斜杠和数字部分,表示子网掩码位数,例如192.168.0.0/24,其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b;3. ipv6地址由8段1~4位十六进制数组成,例如简化版正则表达式为b([0-9a-fa-f]{1,4}:){7}[0-9a-fa-f]{1,4}b,但该表达式不支持双冒号缩写;4. ipv4映射的ipv6地址以::ffff:开头,后接ipv4地址,例如::ffff:192.168.1.1,其正则表达式为b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b。
匹配IP地址是很多网络处理任务中常见的需求,比如日志分析、数据清洗或者防火墙规则设置。正则表达式(Regex)是一个非常合适的工具来完成这个任务。但IP地址有不同格式(IPv4、带子网掩码的IPv4、IPv6等),每种写法都有不同的匹配方式。
下面介绍四种常见的IP地址格式及其对应的正则表达式写法,方便你在实际场景中灵活使用。
IPv4 地址:x.x.x.x
这是最常见的IPv4地址格式,由四组0到255之间的数字组成,每组用点分隔。例如:192.168.1.1 或 8.8.8.8。
要正确匹配这类地址,不能简单地只看有没有四个数字和三个点,还要确保每个数字段在0~255之间。
正则表达式:
b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b
说明:
- b 表示单词边界,避免匹配到其他包含IP形式的字符串。
- 每个数字段分为三类:
- 25[0-5] 匹配250~255
- 2[0-4][0-9] 匹配200~249
- [01]?[0-9][0-9]? 匹配0~199(支持前导0和省略前导0的情况)
- 最后一个分组没有点,所以单独列出
带子网掩码的IPv4地址:x.x.x.x/xx
这种格式常用于路由或配置文件中,表示一个IP地址加上子网掩码位数,例如:192.168.0.0/24
正则表达式:
b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b
说明:
- / 后面的部分是子网掩码位数,取值范围是0到32
- 所以用 (3[0-2]|[12][0-9]|[0-9]) 来限制合法范围
- 这是在IPv4表达式基础上加了一个斜杠和数字部分
IPv6 地址:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx
IPv6地址比IPv4复杂得多,支持缩写(如省略前导0、双冒号代替连续的0段),因此正则匹配也更复杂。
简化版正则表达式(不支持所有缩写):
b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}b
说明:
- 每段为1~4位十六进制数(0-9和a-f,不区分大小写)
- 总共8段,用冒号分隔
- 该表达式不支持双冒号缩写(如 ::1),如果需要完整支持,正则会变得非常长且复杂,通常建议使用专门的库处理IPv6
IPv4映射的IPv6地址:::ffff:x.x.x.x
有时候你会看到类似 ::ffff:192.168.1.1 的地址,这是IPv6中表示IPv4地址的一种方式。
正则表达式:
b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b
说明:
- 开头固定为 ::ffff:,后面接IPv4地址
- 因此可以复用前面IPv4的正则部分,前面加上固定的前缀即可
基本上就这些常见格式了。根据你的具体使用场景选择合适的形式。如果你只是做基础提取,IPv4和IPv4带掩码的两种可能已经够用;如果涉及IPv6,建议配合专用库进行验证,因为正则很难覆盖所有合法缩写形式。