如何使用正则表达式匹配IP地址?四种格式解析

本文介绍了使用正则表达式匹配四种常见ip地址格式的方法。1. ipv4地址由四组0到255之间的数字组成,每组用点分隔,例如192.168.1.1,其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b;2. 带子网掩码的ipv4地址在ipv4基础上加了一个斜杠和数字部分,表示子网掩码位数,例如192.168.0.0/24,其正则表达式为b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b;3. ipv6地址由8段1~4位十六进制数组成,例如简化版正则表达式为b([0-9a-fa-f]{1,4}:){7}[0-9a-fa-f]{1,4}b,但该表达式不支持双冒号缩写;4. ipv4映射的ipv6地址以::ffff:开头,后接ipv4地址,例如::ffff:192.168.1.1,其正则表达式为b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b。

如何使用正则表达式匹配IP地址?四种格式解析

匹配IP地址是很多网络处理任务中常见的需求,比如日志分析、数据清洗或者防火墙规则设置。正则表达式(Regex)是一个非常合适的工具来完成这个任务。但IP地址有不同格式(IPv4、带子网掩码的IPv4、IPv6等),每种写法都有不同的匹配方式。

如何使用正则表达式匹配IP地址?四种格式解析

下面介绍四种常见的IP地址格式及其对应的正则表达式写法,方便你在实际场景中灵活使用。

如何使用正则表达式匹配IP地址?四种格式解析


IPv4 地址:x.x.x.x

这是最常见的IPv4地址格式,由四组0到255之间的数字组成,每组用点分隔。例如:192.168.1.1 或 8.8.8.8。

要正确匹配这类地址,不能简单地只看有没有四个数字和三个点,还要确保每个数字段在0~255之间。

如何使用正则表达式匹配IP地址?四种格式解析

正则表达式:

b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b

说明:

  • b 表示单词边界,避免匹配到其他包含IP形式的字符串
  • 每个数字段分为三类:
    • 25[0-5] 匹配250~255
    • 2[0-4][0-9] 匹配200~249
    • [01]?[0-9][0-9]? 匹配0~199(支持前导0和省略前导0的情况)
  • 最后一个分组没有点,所以单独列出

带子网掩码的IPv4地址:x.x.x.x/xx

这种格式常用于路由或配置文件中,表示一个IP地址加上子网掩码位数,例如:192.168.0.0/24

正则表达式:

b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/(3[0-2]|[12][0-9]|[0-9])b

说明:

  • / 后面的部分是子网掩码位数,取值范围是0到32
  • 所以用 (3[0-2]|[12][0-9]|[0-9]) 来限制合法范围
  • 这是在IPv4表达式基础上加了一个斜杠和数字部分

IPv6 地址:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx

IPv6地址比IPv4复杂得多,支持缩写(如省略前导0、双冒号代替连续的0段),因此正则匹配也更复杂。

简化版正则表达式(不支持所有缩写):

b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}b

说明:

  • 每段为1~4位十六进制数(0-9和a-f,不区分大小写)
  • 总共8段,用冒号分隔
  • 该表达式不支持双冒号缩写(如 ::1),如果需要完整支持,正则会变得非常长且复杂,通常建议使用专门的库处理IPv6

IPv4映射的IPv6地址:::ffff:x.x.x.x

有时候你会看到类似 ::ffff:192.168.1.1 的地址,这是IPv6中表示IPv4地址的一种方式。

正则表达式:

b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b

说明:

  • 开头固定为 ::ffff:,后面接IPv4地址
  • 因此可以复用前面IPv4的正则部分,前面加上固定的前缀即可

基本上就这些常见格式了。根据你的具体使用场景选择合适的形式。如果你只是做基础提取,IPv4和IPv4带掩码的两种可能已经够用;如果涉及IPv6,建议配合专用库进行验证,因为正则很难覆盖所有合法缩写形式。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享