如何根据内嵌数字重排字符串中的单词-小浪学习网

如何根据内嵌数字重排字符串中的单词

本教程将探讨如何根据字符串中内嵌的数字对单词进行重新排序。我们将以“my1kiran4name2is3”为例，目标输出为“my name is kiran”。文章将详细介绍一种基于Java正则表达式（Lookarounds）和Stream API的解决方案，解析其工作原理，并讨论该方法在简洁性与可读性之间的权衡，并提供确保正确排序的优化方案。

问题定义

给定一个字符串，其中包含由数字（1到9）后缀的单词。任务是根据这些数字对单词进行重新排列，使它们按照数字的升序出现，最终输出一个仅包含单词并以空格分隔的字符串。

输入示例： “my1kiran4name2is3”

期望输出： “my name is kiran”

解释：

my 对应数字 1
name 对应数字 2
is 对应数字 3
kiran 对应数字 4 按照数字升序排列后，得到 my, name, is, kiran。

核心思路

解决此类问题的基本思路可以概括为以下几个步骤：

分解： 将原始字符串分解成独立的“单词+数字”片段。
提取： 从每个片段中分别提取出单词和对应的数字。
映射： 将提取出的数字作为键，单词作为值，存储在一个数据结构中，以便后续按数字排序。
重排与组合： 按照数字的升序遍历存储的键值对，并将其对应的单词按顺序拼接成最终的字符串。

Java实现详解

以下是使用Java 8+ 的Stream API和正则表达式实现上述逻辑的示例代码。为了确保最终输出的顺序正确，我们特意使用了 Treemap 来存储单词和数字的映射，因为它能自动根据键（即数字）进行排序。

import java.util.Arrays; import java.util.Map; import java.util.TreeMap; import java.util.stream.Collectors;  public class StringReorderer {      public static String reorderStringByNumbers(String inputString) {         // 1. 使用正向后行断言 (?<=d) 分割字符串         //    这将字符串分割成 "单词+数字" 的片段，例如 "my1", "kiran4", "name2", "is3"         Map<Integer, String> orderedWords = Arrays.asList(inputString.split("(?<=d)"))                 .stream()                 // 2. 对每个片段，使用正向前行断言 (?=d) 再次分割                 //    将 "单词+数字" 分割成 ["单词", "数字"] 数组，例如 ["my", "1"]                 .map(s -> s.split("(?=d)"))                 // 3. 收集到 TreeMap 中，TreeMap 会根据键（数字）自动排序                 //    键是数字 (Integer.parseInt(e[1]))，值是单词 (e[0])                 .collect(Collectors.toMap(                         e -> Integer.parseInt(e[1]), // 键：将数字字符串转换为整数                         e -> e[0],                   // 值：单词字符串                         (oldValue, newValue) -> oldValue, // 合并函数，处理重复键（此处通常不发生）                         TreeMap::new                  // 指定使用 TreeMap 来保证键的顺序                 ));          // 4. 从 TreeMap 中获取所有单词（值），它们已按数字键排序，然后用空格连接         return orderedWords.values()                 .stream()                 .collect(Collectors.joining(" "));     }      public static void main(String[] args) {         String input = "my1kiran4name2is3";         String output = reorderStringByNumbers(input);         System.out.println("原始字符串: " + input);         System.out.println("重排后字符串: " + output); // 期望输出: my name is kiran     } }

代码解析：

inputString.split(“(?:
- split() 方法用于根据正则表达式将字符串分割成数组。
- (?正向后行断言 (Positive Lookbehind)。它表示匹配一个位置，该位置的前面必须是一个数字 (d)。
- 效果： 它会在每个数字的后面进行分割，但不会将数字本身包含在分隔符中。
  - 例如，”my1kiran4name2is3″ 会被分割成 [“my1”, “kiran4”, “name2”, “is3”]。
.map(s -> s.split(“(?=d)”)):
- map() 操作将流中的每个元素（例如 “my1″）转换为一个新的元素。
- s.split(“(?=d)”) 再次使用 split()。
- (?=d) 是一个正向前行断言 (Positive Lookahead)。它表示匹配一个位置，该位置的后面必须是一个数字 (d)。
- 效果： 它会在每个数字的前面进行分割，但同样不将数字包含在分隔符中。
  - 例如，”my1″ 会被分割成 [“my”, “1”]。
  - 最终，流中的元素将是 [[“my”, “1”], [“kiran”, “4”], [“name”, “2”], [“is”, “3”]]。
.collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0], (oldValue, newValue) -> oldValue, TreeMap::new)):
- Collectors.toMap() 用于将流中的元素收集到一个 Map 中。
- e -> Integer.parseInt(e[1])：定义了如何从每个数组 e 中提取键。e[1] 是数字字符串（例如 “1”），将其转换为 Integer。
- e -> e[0]：定义了如何从每个数组 e 中提取值。e[0] 是单词字符串（例如 “my”）。
- (oldValue, newValue) -> oldValue：这是一个合并函数，用于处理当存在重复键时的情况。在这个特定问题中，由于数字是唯一的（1-9），通常不会触发。
- TreeMap::new：这是一个关键的参数，它指定了要创建的 Map 的具体实现是 TreeMap。TreeMap 会根据其键的自然顺序（对于 Integer 来说就是数值大小）自动对元素进行排序。这确保了我们后续获取值时是按数字顺序的。
orderedWords.values().stream().collect(Collectors.joining(” “)):
- orderedWords.values() 获取 TreeMap 中所有值的集合。由于 TreeMap 保持了键的排序，因此这些值（单词）的迭代顺序也是按其对应数字排序的。
- .stream() 将值集合转换为流。
- Collectors.joining(” “) 将流中的所有字符串元素用空格连接起来，形成最终的输出字符串。

注意事项与优化

可读性与维护性： 尽管上述解决方案非常简洁和函数式，但高度依赖正则表达式的 Lookaround 特性以及 Stream API 的链式调用，对于不熟悉这些概念的开发者来说，代码的可读性和维护性可能会有所降低。在实际项目中，如果团队成员对这些高级特性不熟悉，或者问题逻辑更复杂，可能需要考虑使用更传统的循环和条件判断来提高代码的清晰度。
数字范围与类型： 本教程的解决方案假定数字是1到9的单个数字。如果数字可以是多位（例如 “word10″），当前的 (?
输入健壮性： 当前代码假设输入字符串格式始终正确，即每个单词后都紧跟着一个数字。如果存在以下情况，可能需要额外的错误处理：
- 单词后面没有数字。
- 数字不在单词的末尾。
- 非数字字符出现在应该出现数字的位置。
- 数字重复。针对这些情况，可以考虑在解析阶段增加 try-catch 块或更严格的正则表达式匹配来验证输入。
性能考量： 对于非常大的字符串或需要处理大量字符串的情况，Stream API 和正则表达式通常具有良好的性能。然而，如果性能是极致的关键，并且输入格式非常简单，手动迭代和解析可能会在某些特定场景下提供微小的性能优势，但通常不建议为了微小的性能提升而牺牲代码的简洁性和可读性。

总结

通过本教程，我们学习了如何利用Java的正则表达式（特别是正向后行断言和正向前行断言）和Stream API，结合 TreeMap 的排序特性，高效地解决根据内嵌数字重排字符串中单词的问题。这种方法展示了Java 8+ 强大而富有表现力的编程范式。在实际应用中，选择合适的解决方案时，应综合考虑代码的简洁性、可读性、性能需求以及对输入数据健壮性的要求。

文章版权归作者所有，未经允许请勿转载。

THE END

JAVA教程
# ai # 字符串 # red # 循环 # Java # 数据结构 # 正则表达式 # try # map # catch # 排列 # 键值对 # Integer