如何使用正则表达式匹配IP地址？四种格式解析-小浪学习网

本文介绍了使用正则表达式匹配四种常见ip地址格式的方法。1. ipv4地址由四组0到255之间的数字组成，每组用点分隔，例如192.168.1.1，其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b；2. 带子网掩码的ipv4地址在ipv4基础上加了一个斜杠和数字部分，表示子网掩码位数，例如192.168.0.0/24，其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b；3. ipv6地址由8段1~4位十六进制数组成，例如简化版正则表达式为b([0-9a-fa-f]{1,4}:){7}[0-9a-fa-f]{1,4}b，但该表达式不支持双冒号缩写；4. ipv4映射的ipv6地址以::ffff:开头，后接ipv4地址，例如::ffff:192.168.1.1，其正则表达式为b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b。

如何使用正则表达式匹配IP地址？四种格式解析

匹配IP地址是很多网络处理任务中常见的需求，比如日志分析、数据清洗或者防火墙规则设置。正则表达式（Regex）是一个非常合适的工具来完成这个任务。但IP地址有不同格式（IPv4、带子网掩码的IPv4、IPv6等），每种写法都有不同的匹配方式。

如何使用正则表达式匹配IP地址？四种格式解析

下面介绍四种常见的IP地址格式及其对应的正则表达式写法，方便你在实际场景中灵活使用。

如何使用正则表达式匹配IP地址？四种格式解析

IPv4 地址：x.x.x.x

这是最常见的IPv4地址格式，由四组0到255之间的数字组成，每组用点分隔。例如：192.168.1.1 或 8.8.8.8。

要正确匹配这类地址，不能简单地只看有没有四个数字和三个点，还要确保每个数字段在0~255之间。

如何使用正则表达式匹配IP地址？四种格式解析

正则表达式：

b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b

说明：

b 表示单词边界，避免匹配到其他包含IP形式的字符串。
每个数字段分为三类：
- 25[0-5] 匹配250~255
- 2[0-4][0-9] 匹配200~249
- [01]?[0-9][0-9]? 匹配0~199（支持前导0和省略前导0的情况）
最后一个分组没有点，所以单独列出

带子网掩码的IPv4地址：x.x.x.x/xx

这种格式常用于路由或配置文件中，表示一个IP地址加上子网掩码位数，例如：192.168.0.0/24

正则表达式：

b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b

说明：

/ 后面的部分是子网掩码位数，取值范围是0到32
所以用 (3[0-2]|[12][0-9]|[0-9]) 来限制合法范围
这是在IPv4表达式基础上加了一个斜杠和数字部分

IPv6 地址：xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx

IPv6地址比IPv4复杂得多，支持缩写（如省略前导0、双冒号代替连续的0段），因此正则匹配也更复杂。

简化版正则表达式（不支持所有缩写）：

b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}b

说明：

每段为1~4位十六进制数（0-9和a-f，不区分大小写）
总共8段，用冒号分隔
该表达式不支持双冒号缩写（如 ::1），如果需要完整支持，正则会变得非常长且复杂，通常建议使用专门的库处理IPv6

IPv4映射的IPv6地址：::ffff:x.x.x.x

有时候你会看到类似 ::ffff:192.168.1.1 的地址，这是IPv6中表示IPv4地址的一种方式。

正则表达式：

b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b

说明：

开头固定为 ::ffff:，后面接IPv4地址
因此可以复用前面IPv4的正则部分，前面加上固定的前缀即可

基本上就这些常见格式了。根据你的具体使用场景选择合适的形式。如果你只是做基础提取，IPv4和IPv4带掩码的两种可能已经够用；如果涉及IPv6，建议配合专用库进行验证，因为正则很难覆盖所有合法缩写形式。

文章版权归作者所有，未经允许请勿转载。

THE END