如何根据内嵌数字重排字符串中的单词

如何根据内嵌数字重排字符串中的单词

本教程将探讨如何根据字符串中内嵌的数字对单词进行重新排序。我们将以“my1kiran4name2is3”为例,目标输出为“my name is kiran”。文章将详细介绍一种基于Java正则表达式(Lookarounds)和Stream API的解决方案,解析其工作原理,并讨论该方法在简洁性与可读性之间的权衡,并提供确保正确排序的优化方案。

问题定义

给定一个字符串,其中包含由数字(1到9)后缀的单词。任务是根据这些数字对单词进行重新排列,使它们按照数字的升序出现,最终输出一个仅包含单词并以空格分隔的字符串。

输入示例: “my1kiran4name2is3”

期望输出: “my name is kiran”

解释:

  • my 对应数字 1
  • name 对应数字 2
  • is 对应数字 3
  • kiran 对应数字 4 按照数字升序排列后,得到 my, name, is, kiran。

核心思路

解决此类问题的基本思路可以概括为以下几个步骤:

  1. 分解: 将原始字符串分解成独立的“单词+数字”片段。
  2. 提取: 从每个片段中分别提取出单词和对应的数字。
  3. 映射: 将提取出的数字作为键,单词作为值,存储在一个数据结构中,以便后续按数字排序。
  4. 重排与组合: 按照数字的升序遍历存储的键值对,并将其对应的单词按顺序拼接成最终的字符串。

Java实现详解

以下是使用Java 8+ 的Stream API和正则表达式实现上述逻辑的示例代码。为了确保最终输出的顺序正确,我们特意使用了 Treemap 来存储单词和数字的映射,因为它能自动根据键(即数字)进行排序。

import java.util.Arrays; import java.util.Map; import java.util.TreeMap; import java.util.stream.Collectors;  public class StringReorderer {      public static String reorderStringByNumbers(String inputString) {         // 1. 使用正向后行断言 (?<=d) 分割字符串         //    这将字符串分割成 "单词+数字" 的片段,例如 "my1", "kiran4", "name2", "is3"         Map<Integer, String> orderedWords = Arrays.asList(inputString.split("(?<=d)"))                 .stream()                 // 2. 对每个片段,使用正向前行断言 (?=d) 再次分割                 //    将 "单词+数字" 分割成 ["单词", "数字"] 数组,例如 ["my", "1"]                 .map(s -> s.split("(?=d)"))                 // 3. 收集到 TreeMap 中,TreeMap 会根据键(数字)自动排序                 //    键是数字 (Integer.parseInt(e[1])),值是单词 (e[0])                 .collect(Collectors.toMap(                         e -> Integer.parseInt(e[1]), // 键:将数字字符串转换为整数                         e -> e[0],                   // 值:单词字符串                         (oldValue, newValue) -> oldValue, // 合并函数,处理重复键(此处通常不发生)                         TreeMap::new                  // 指定使用 TreeMap 来保证键的顺序                 ));          // 4. 从 TreeMap 中获取所有单词(值),它们已按数字键排序,然后用空格连接         return orderedWords.values()                 .stream()                 .collect(Collectors.joining(" "));     }      public static void main(String[] args) {         String input = "my1kiran4name2is3";         String output = reorderStringByNumbers(input);         System.out.println("原始字符串: " + input);         System.out.println("重排后字符串: " + output); // 期望输出: my name is kiran     } }

代码解析:

  1. inputString.split(“(?:

    • split() 方法用于根据正则表达式将字符串分割成数组。
    • (?正向后行断言 (Positive Lookbehind)。它表示匹配一个位置,该位置的前面必须是一个数字 (d)。
    • 效果: 它会在每个数字的后面进行分割,但不会将数字本身包含在分隔符中。
      • 例如,”my1kiran4name2is3″ 会被分割成 [“my1”, “kiran4”, “name2”, “is3”]。
  2. .map(s -> s.split(“(?=d)”)):

    • map() 操作将流中的每个元素(例如 “my1″)转换为一个新的元素。
    • s.split(“(?=d)”) 再次使用 split()。
    • (?=d) 是一个正向前行断言 (Positive Lookahead)。它表示匹配一个位置,该位置的后面必须是一个数字 (d)。
    • 效果: 它会在每个数字的前面进行分割,但同样不将数字包含在分隔符中。
      • 例如,”my1″ 会被分割成 [“my”, “1”]。
      • 最终,流中的元素将是 [[“my”, “1”], [“kiran”, “4”], [“name”, “2”], [“is”, “3”]]。
  3. .collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0], (oldValue, newValue) -> oldValue, TreeMap::new)):

    • Collectors.toMap() 用于将流中的元素收集到一个 Map 中。
    • e -> Integer.parseInt(e[1]):定义了如何从每个数组 e 中提取键。e[1] 是数字字符串(例如 “1”),将其转换为 Integer。
    • e -> e[0]:定义了如何从每个数组 e 中提取值。e[0] 是单词字符串(例如 “my”)。
    • (oldValue, newValue) -> oldValue:这是一个合并函数,用于处理当存在重复键时的情况。在这个特定问题中,由于数字是唯一的(1-9),通常不会触发。
    • TreeMap::new:这是一个关键的参数,它指定了要创建的 Map 的具体实现是 TreeMap。TreeMap 会根据其键的自然顺序(对于 Integer 来说就是数值大小)自动对元素进行排序。这确保了我们后续获取值时是按数字顺序的。
  4. orderedWords.values().stream().collect(Collectors.joining(” “)):

    • orderedWords.values() 获取 TreeMap 中所有值的集合。由于 TreeMap 保持了键的排序,因此这些值(单词)的迭代顺序也是按其对应数字排序的。
    • .stream() 将值集合转换为流。
    • Collectors.joining(” “) 将流中的所有字符串元素用空格连接起来,形成最终的输出字符串。

注意事项与优化

  • 可读性与维护性: 尽管上述解决方案非常简洁和函数式,但高度依赖正则表达式的 Lookaround 特性以及 Stream API 的链式调用,对于不熟悉这些概念的开发者来说,代码的可读性和维护性可能会有所降低。在实际项目中,如果团队成员对这些高级特性不熟悉,或者问题逻辑更复杂,可能需要考虑使用更传统的循环和条件判断来提高代码的清晰度。
  • 数字范围与类型: 本教程的解决方案假定数字是1到9的单个数字。如果数字可以是多位(例如 “word10″),当前的 (?
  • 输入健壮性: 当前代码假设输入字符串格式始终正确,即每个单词后都紧跟着一个数字。如果存在以下情况,可能需要额外的错误处理:
    • 单词后面没有数字。
    • 数字不在单词的末尾。
    • 非数字字符出现在应该出现数字的位置。
    • 数字重复。 针对这些情况,可以考虑在解析阶段增加 try-catch 块或更严格的正则表达式匹配来验证输入。
  • 性能考量: 对于非常大的字符串或需要处理大量字符串的情况,Stream API 和正则表达式通常具有良好的性能。然而,如果性能是极致的关键,并且输入格式非常简单,手动迭代和解析可能会在某些特定场景下提供微小的性能优势,但通常不建议为了微小的性能提升而牺牲代码的简洁性和可读性。

总结

通过本教程,我们学习了如何利用Java的正则表达式(特别是正向后行断言和正向前行断言)和Stream API,结合 TreeMap 的排序特性,高效地解决根据内嵌数字重排字符串中单词的问题。这种方法展示了Java 8+ 强大而富有表现力的编程范式。在实际应用中,选择合适的解决方案时,应综合考虑代码的简洁性、可读性、性能需求以及对输入数据健壮性的要求。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享