提取嵌套括号内的特定内容:JavaScript 括号解析教程

提取嵌套括号内的特定内容:JavaScript 括号解析教程

本文旨在提供一个通用的、非正则表达式的解决方案,用于解析包含嵌套括号的字符串,并提取特定部分。通过构建一个括号树,我们可以轻松地遍历和搜索所需的匹配项,即使在存在未闭合括号的情况下也能有效工作。本教程将详细介绍如何使用 BracketTree 类来实现这一目标,并提供多种过滤遍历示例,以满足不同的提取需求。

在处理包含嵌套括号的字符串时,正则表达式可能会变得复杂且难以维护。尤其是在括号嵌套层数不确定,或者存在未闭合括号的情况下,正则表达式的编写和调试会变得非常困难。本文介绍一种基于树形结构的解析方法,可以有效地解决这类问题。

BracketTree 类

BracketTree 类用于构建和遍历括号树。以下是该类的详细说明:

class BracketTree {      constructor (brackets, String) {          if (typeof brackets != 'string' || brackets.length != 2 || brackets[0] == brackets[1]) {             return NULL;         }          let opening = brackets[0];         let closing = brackets[1];          function parse (start) {              let children = [];             let pos = start;              loop: while (pos < string.length) {                  switch (string[pos]) {                  case opening:                     let child = parse(pos + 1);                     children.push(child);                     if (child.end == string.length) {                         break loop;                     }                     pos = child.end;                     break;                  case closing:                     if (start == 0) {                         children = [{                             children, start, end: pos, opened: false, closed: true,                             contents: string.slice(0, pos)                         }];                     }                     else {                         return {                             children, start, end: pos, opened: true, closed: true,                             contents: string.slice(start, pos)                         };                     }                 }                  pos++;             }              return (start == 0)? {                 children, start, end: string.length, opened: false, closed: false,                 contents: string             }: {                 children, start, end: string.length, opened: true, closed: false,                 contents: string.slice(start)             };         }          this.root = parse(0);     }      traverse (callback) {          if (typeof callback != 'function') {             return false;         }          let root = this.root;         let input = root.contents;         let nodeId = 0;          function recurse (parent, level) {              function callbackLeaf (start, end) {                 callback({                     root, parent, level,                     nodeId: nodeId++, childId: childId++,                     start, end, contents: input.slice(start, end)                 });             }              function callbackBranch (branch) {                 return callback({                     root, parent, branch, level,                     nodeId: nodeId++, childId: childId++                 });             }              let children = parent.children;             let childId = 0;             if (children.length == 0) {                 callbackLeaf(parent.start, parent.end);                 return;             }              callbackLeaf(parent.start, children[0].start - children[0].opened);             if (callbackBranch(children[0])) {                 recurse(children[0], level+1);             }              for (var i = 0; i < children.length-1; i++) {                 callbackLeaf(children[i].end + children[i].closed, children[i+1].start - children[i+1].opened);                 if (callbackBranch(children[i+1])) {                     recurse(children[i+1], level+1);                 }             }              callbackLeaf(children[i].end + children[i].closed, parent.end);         }          recurse(root, 0);         return true;     } }

构造函数

立即学习Java免费学习笔记(深入)”;

  • constructor(brackets, string):接受两个参数,brackets 是一个包含开始和结束括号的字符串,string 是要解析的字符串。如果 brackets 的格式不正确,则返回 null。

方法:

  • traverse(callback):接受一个回调函数作为参数,用于遍历括号树的每个节点。回调函数接收一个包含节点信息的对象作为参数,包括 root(根节点)、parent(父节点)、branch(当前节点,如果它是分支节点)、level(节点层级)、nodeId(节点ID)、childId(子节点ID)、start(节点开始位置)、end(节点结束位置)和 contents(节点内容)。

使用示例

以下是一些使用 BracketTree 类的示例:

let input = 'NOT OPENED {3}2}1}***{avatarurl {id {message}}} blah blah blah {1{2{3} NOT CLOSED'; let tree = new BracketTree('{}', input);  function filteredTraverse (caption, leafFilter, branchFilter) {     console.log(`${'-'.repeat(29 - caption.length/2)} ${caption} `.padEnd(60, '-'));     leafFilter ??= () => true;     branchFilter ??= () => true;     tree.traverse((args) => {         if (args.branch) {             return branchFilter(args);         }         if (leafFilter(args)) {             console.log(`${'  '.repeat(args.level)}<${args.contents}>`);         }     }); }  filteredTraverse(     'Ignore unbalanced and all their descendants',     null,     ({branch}) => branch.opened && branch.closed );  filteredTraverse(     'Ignore unbalanced but include their descendants',     ({parent}) => parent.opened == parent.closed );  filteredTraverse(     'Ignore empty',     ({start, end}) => start != end );  filteredTraverse(     'Show non-empty first children only',     ({childId, start, end}) => childId == 0 && start != end );

代码解释:

  1. 创建 BracketTree 实例: 使用包含嵌套括号的字符串创建一个 BracketTree 实例。
  2. filteredTraverse 函数: 定义一个 filteredTraverse 函数,用于简化遍历过程。它接受一个标题 caption,以及两个可选的过滤函数 leafFilter 和 branchFilter。leafFilter 用于过滤叶子节点,branchFilter 用于过滤分支节点。
  3. 遍历示例: 通过调用 filteredTraverse 函数,展示了不同的过滤遍历示例:
    • 忽略未闭合括号及其所有子节点: 只处理完全闭合的括号。
    • 忽略未闭合括号,但包含其子节点: 处理所有括号,即使它们未完全闭合。
    • 忽略空节点: 排除内容为空的括号。
    • 只显示非空的第一个子节点: 只显示每个父节点的第一个非空子节点。

注意事项

  • BracketTree 类假设输入的括号是成对出现的,并且开始和结束括号是不同的。
  • traverse 方法会遍历整个括号树,因此在处理大型字符串时,性能可能会受到影响。
  • 回调函数可以根据需要访问节点的信息,并执行相应的操作。

总结

本文介绍了一种使用 BracketTree 类解析包含嵌套括号的字符串的方法。这种方法避免了使用复杂的正则表达式,并且可以有效地处理未闭合括号的情况。通过遍历括号树,可以轻松地提取所需的匹配项,并执行各种操作。该方法在处理需要解析嵌套结构的场景中非常有用,例如解析配置文件、处理编程语言代码等。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享