使用正则表达式忽略字符串前N个字符进行匹配（无需后向断言）-小浪学习网

使用正则表达式忽略字符串前N个字符进行匹配（无需后向断言）

本文介绍了如何在不支持后向断言的正则表达式引擎中，通过巧妙的模式设计，忽略字符串前N个字符，并提取目标子字符串。通过一个实际案例，详细讲解了如何构建正则表达式，以及如何在JavaScript中使用该表达式提取所需内容。

正则表达式构建

在某些正则表达式引擎（如IBM LogDNA使用的引擎）中，不支持后向断言。这意味着我们无法直接指定匹配内容之前的模式，并要求该模式必须存在，但不包含在最终匹配结果中。

在这种情况下，我们需要采用一种不同的策略，即先匹配我们想要忽略的部分，然后捕获我们真正需要的部分。

针对以下示例字符串：

returnedData=dfsavdasvfdvdvvjwfwhvfwjhfvwjhevfwjvfw04040000N.sdfsgs.sfgakhvsafjhafj  ksajbd   234.234 bfsdf  sudhfkusa   77907 23 gfksahgkf bkhkjakjsf - CB123214124

我们的目标是提取 N.sdfsgs.sfgakhvsafjhafj ksajbd 234.234 bfsdf sudhfkusa 77907 23 gfksahgkf bkhkjakjsf – CB 这部分内容。

可以使用以下正则表达式：

returnedDatas*=s*D+d++([A-Za-z0-9=:s-@+?.]+s*-s*CB)

表达式解释：

returnedDatas*=s*: 匹配字符串 “returnedData”，后跟任意数量的空白字符，然后是等号，再后跟任意数量的空白字符。这部分匹配了字符串的开头部分，并将其忽略。
D+: 匹配一个或多个非数字字符。这部分用于匹配等号后面的非数字字符，例如 “dfsavdasvfdvdvvjwfwhvfwjhfvwjhevfwjvfw”。
d++: 匹配一个或多个数字字符。这部分匹配了数字部分，例如 “04040000”。++ 是一个占有优先量词，可以提高匹配效率。
([A-Za-z0-9=:s-@+?.]+s*-s*CB): 这是捕获组。
- [A-Za-z0-9=:s-@+?.]+: 匹配一个或多个字母、数字、等号、冒号、空白字符、连字符、at符号、加号、问号、点号。这部分匹配了我们想要提取的内容。
- s*-s*CB: 匹配任意数量的空白字符，然后是连字符，再后跟任意数量的空白字符，最后是 “CB”。这部分确保了匹配的内容以 ” – CB” 结尾。

JavaScript 示例

以下是一个 JavaScript 示例，展示了如何使用上述正则表达式提取目标字符串：

const str = "returnedData=dfsavdasvfdvdvvjwfwhvfwjhfvwjhevfwjvfw04040000N.sdfsgs.sfgakhvsafjhafj  ksajbd   234.234 bfsdf  sudhfkusa   77907 23 gfksahgkf bkhkjakjsf - CB123214124"; const matched = str.match(/returnedDatas*=s*D+d+([A-Za-z0-9=:s-@+?.]+s*-s*CB)/);  if (matched) {   console.log(matched[1]); // 输出: N.sdfsgs.sfgakhvsafjhafj  ksajbd   234.234 bfsdf  sudhfkusa   77907 23 gfksahgkf bkhkjakjsf - CB } else {   console.log("No match found."); }

代码解释：