正则表达式中的零宽断言是什么？如何使用？-小浪学习网

零宽断言是正则表达式中的“条件判断”，用于检查某位置前后是否满足规则但不匹配字符本身。它常用于提取特定格式文本、精确匹配词语和替换符合条件的内容，如用(?

正则表达式中的零宽断言是什么？如何使用？

零宽断言听起来有点玄乎，其实它就是正则表达式中的一种“条件判断”，用来检查某个位置前后是否满足某种规则，但又不真正“吃掉”这些字符。也就是说，它只判断，不匹配内容本身。

正则表达式中的零宽断言是什么？如何使用？

理解这一点之后，你会发现零宽断言在一些特定场景下非常有用，比如提取特定格式的文本、做复杂的文本替换等。

正则表达式中的零宽断言是什么？如何使用？

零宽断言（Zero-width assertions）并不匹配任何字符，它们只是在某个位置上进行“条件测试”。如果测试通过，整个正则表达式才继续匹配；否则就跳过当前位置。

常见的零宽断言有以下几种：

正则表达式中的零宽断言是什么？如何使用？

举个例子，假设你想找的是“cat”这个词，但只在它后面跟着“tom”时才匹配：

cat(?=stom)

这个表达式会匹配“cat tom”中的“cat”，但不会匹配单独的“cat”。

比如从一段日志中提取订单号，前提是订单号前面是“Order ID: ”，你可以这样写：

(?<=Order ID: )d+

这条正则的意思是：匹配一串数字，前提是它的前面正好是“Order ID: ”。

这种写法常用于数据抓取、日志分析等任务中，能避免误匹配其他数字。

有时候你只想匹配“book”这个词，而不是“booking”或“booklet”，这时候可以用单词边界 b，也可以用零宽断言来更灵活地控制：

bbookb

或者：

(?<!w)book(?!w)

后者表示“book”的前后都不是字母或数字，可以更精确地定位独立单词。

比如替换所有不是以“http”开头的链接：

(?!https?://)bwww.S+

这个表达式会跳过已有的完整网址，只匹配那些没有协议头的“www.”链接，方便后续补全。

不是所有语言都支持 lookbehind
比如 JavaScript 的正则直到 ES2018 才开始支持正向和负向后行断言，而且有些语言（如 python）对 lookbehind 中的内容有限制（必须固定长度）。
性能问题
零宽断言本质上是在每个位置尝试匹配，可能会影响效率，特别是在处理大文本时。如果你不需要这么复杂的逻辑，尽量用更简单的正则结构替代。
顺序很重要
比如 a(?=b) 和 a(?!b) 是相反的条件，稍不留神就会出错。写的时候要特别注意逻辑关系。