本教程将探讨如何根据字符串中内嵌的数字对单词进行重新排序。我们将以“my1kiran4name2is3”为例,目标输出为“my name is kiran”。文章将详细介绍一种基于Java正则表达式(Lookarounds)和Stream API的解决方案,解析其工作原理,并讨论该方法在简洁性与可读性之间的权衡,并提供确保正确排序的优化方案。
问题定义
给定一个字符串,其中包含由数字(1到9)后缀的单词。任务是根据这些数字对单词进行重新排列,使它们按照数字的升序出现,最终输出一个仅包含单词并以空格分隔的字符串。
输入示例: “my1kiran4name2is3”
期望输出: “my name is kiran”
解释:
- my 对应数字 1
- name 对应数字 2
- is 对应数字 3
- kiran 对应数字 4 按照数字升序排列后,得到 my, name, is, kiran。
核心思路
解决此类问题的基本思路可以概括为以下几个步骤:
- 分解: 将原始字符串分解成独立的“单词+数字”片段。
- 提取: 从每个片段中分别提取出单词和对应的数字。
- 映射: 将提取出的数字作为键,单词作为值,存储在一个数据结构中,以便后续按数字排序。
- 重排与组合: 按照数字的升序遍历存储的键值对,并将其对应的单词按顺序拼接成最终的字符串。
Java实现详解
以下是使用Java 8+ 的Stream API和正则表达式实现上述逻辑的示例代码。为了确保最终输出的顺序正确,我们特意使用了 Treemap 来存储单词和数字的映射,因为它能自动根据键(即数字)进行排序。
import java.util.Arrays; import java.util.Map; import java.util.TreeMap; import java.util.stream.Collectors; public class StringReorderer { public static String reorderStringByNumbers(String inputString) { // 1. 使用正向后行断言 (?<=d) 分割字符串 // 这将字符串分割成 "单词+数字" 的片段,例如 "my1", "kiran4", "name2", "is3" Map<Integer, String> orderedWords = Arrays.asList(inputString.split("(?<=d)")) .stream() // 2. 对每个片段,使用正向前行断言 (?=d) 再次分割 // 将 "单词+数字" 分割成 ["单词", "数字"] 数组,例如 ["my", "1"] .map(s -> s.split("(?=d)")) // 3. 收集到 TreeMap 中,TreeMap 会根据键(数字)自动排序 // 键是数字 (Integer.parseInt(e[1])),值是单词 (e[0]) .collect(Collectors.toMap( e -> Integer.parseInt(e[1]), // 键:将数字字符串转换为整数 e -> e[0], // 值:单词字符串 (oldValue, newValue) -> oldValue, // 合并函数,处理重复键(此处通常不发生) TreeMap::new // 指定使用 TreeMap 来保证键的顺序 )); // 4. 从 TreeMap 中获取所有单词(值),它们已按数字键排序,然后用空格连接 return orderedWords.values() .stream() .collect(Collectors.joining(" ")); } public static void main(String[] args) { String input = "my1kiran4name2is3"; String output = reorderStringByNumbers(input); System.out.println("原始字符串: " + input); System.out.println("重排后字符串: " + output); // 期望输出: my name is kiran } }
代码解析:
-
inputString.split(“(?:
- split() 方法用于根据正则表达式将字符串分割成数组。
- (?正向后行断言 (Positive Lookbehind)。它表示匹配一个位置,该位置的前面必须是一个数字 (d)。
- 效果: 它会在每个数字的后面进行分割,但不会将数字本身包含在分隔符中。
- 例如,”my1kiran4name2is3″ 会被分割成 [“my1”, “kiran4”, “name2”, “is3”]。
-
.map(s -> s.split(“(?=d)”)):
- map() 操作将流中的每个元素(例如 “my1″)转换为一个新的元素。
- s.split(“(?=d)”) 再次使用 split()。
- (?=d) 是一个正向前行断言 (Positive Lookahead)。它表示匹配一个位置,该位置的后面必须是一个数字 (d)。
- 效果: 它会在每个数字的前面进行分割,但同样不将数字包含在分隔符中。
- 例如,”my1″ 会被分割成 [“my”, “1”]。
- 最终,流中的元素将是 [[“my”, “1”], [“kiran”, “4”], [“name”, “2”], [“is”, “3”]]。
-
.collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0], (oldValue, newValue) -> oldValue, TreeMap::new)):
- Collectors.toMap() 用于将流中的元素收集到一个 Map 中。
- e -> Integer.parseInt(e[1]):定义了如何从每个数组 e 中提取键。e[1] 是数字字符串(例如 “1”),将其转换为 Integer。
- e -> e[0]:定义了如何从每个数组 e 中提取值。e[0] 是单词字符串(例如 “my”)。
- (oldValue, newValue) -> oldValue:这是一个合并函数,用于处理当存在重复键时的情况。在这个特定问题中,由于数字是唯一的(1-9),通常不会触发。
- TreeMap::new:这是一个关键的参数,它指定了要创建的 Map 的具体实现是 TreeMap。TreeMap 会根据其键的自然顺序(对于 Integer 来说就是数值大小)自动对元素进行排序。这确保了我们后续获取值时是按数字顺序的。
-
orderedWords.values().stream().collect(Collectors.joining(” “)):
- orderedWords.values() 获取 TreeMap 中所有值的集合。由于 TreeMap 保持了键的排序,因此这些值(单词)的迭代顺序也是按其对应数字排序的。
- .stream() 将值集合转换为流。
- Collectors.joining(” “) 将流中的所有字符串元素用空格连接起来,形成最终的输出字符串。
注意事项与优化
- 可读性与维护性: 尽管上述解决方案非常简洁和函数式,但高度依赖正则表达式的 Lookaround 特性以及 Stream API 的链式调用,对于不熟悉这些概念的开发者来说,代码的可读性和维护性可能会有所降低。在实际项目中,如果团队成员对这些高级特性不熟悉,或者问题逻辑更复杂,可能需要考虑使用更传统的循环和条件判断来提高代码的清晰度。
- 数字范围与类型: 本教程的解决方案假定数字是1到9的单个数字。如果数字可以是多位(例如 “word10″),当前的 (?
- 输入健壮性: 当前代码假设输入字符串格式始终正确,即每个单词后都紧跟着一个数字。如果存在以下情况,可能需要额外的错误处理:
- 性能考量: 对于非常大的字符串或需要处理大量字符串的情况,Stream API 和正则表达式通常具有良好的性能。然而,如果性能是极致的关键,并且输入格式非常简单,手动迭代和解析可能会在某些特定场景下提供微小的性能优势,但通常不建议为了微小的性能提升而牺牲代码的简洁性和可读性。
总结
通过本教程,我们学习了如何利用Java的正则表达式(特别是正向后行断言和正向前行断言)和Stream API,结合 TreeMap 的排序特性,高效地解决根据内嵌数字重排字符串中单词的问题。这种方法展示了Java 8+ 强大而富有表现力的编程范式。在实际应用中,选择合适的解决方案时,应综合考虑代码的简洁性、可读性、性能需求以及对输入数据健壮性的要求。