本文深入探讨了Java中归并排序实现时常遇到的一个关键问题:当将排序后的元素回写到原始列表中时,误用ArrayList.add()而非ArrayList.set()会导致数据覆盖或仅部分元素被正确排序。文章详细解释了这两种方法的区别,提供了正确的代码示例,并强调了使用接口而非具体实现类等编程最佳实践,以确保归并排序的稳定性和效率,同时探讨了如何处理复杂数据关联排序的策略。
归并排序原理概述
归并排序(merge sort)是一种高效、稳定的排序算法,其核心思想是“分而治之”。它将一个大问题分解为若干个小问题,递归地解决这些小问题,然后将小问题的解合并起来,从而得到原问题的解。具体步骤如下:
- 分解(Divide):将待排序的序列从中间一分为二。
- 解决(Conquer):对这两个子序列分别递归地进行归并排序,直到子序列只包含一个元素(一个元素被认为是自然有序的)。
- 合并(Combine):将两个已排序的子序列合并成一个完整的有序序列。合并是归并排序的关键步骤,它通过比较两个子序列的元素,将较小的元素依次放入一个临时空间,直至所有元素都被合并。
常见实现错误:ArrayList.add()的误用
在Java中实现归并排序的合并(merge)阶段时,一个常见的错误是使用ArrayList.add()方法将临时列表中排序好的元素回写到原始列表。这会导致意想不到的行为,例如只排序部分元素或数据被覆盖。
考虑以下错误的合并实现片段:
// 错误的回写方式 for(j = 0; j< n; j++) { a.add(from+j, b.get(j)); // 错误:使用 add 方法 }
ArrayList.add(index, element)方法的行为是:在指定索引处插入元素,并将该索引及其之后的所有元素向后移动一位。这意味着每次调用add()时,原始列表a的尺寸都会增加,并且现有元素的索引会发生变化。
例如,如果原始列表a有5个元素,你想将临时列表b中的5个排序好的元素放回a的特定位置。当第一次调用a.add(from, b.get(0))时,a的尺寸变为6。第二次调用a.add(from+1, b.get(1))时,a的尺寸变为7,并且之前插入的元素以及原始元素都会被进一步向后移动。这导致:
立即学习“Java免费学习笔记(深入)”;
- 列表尺寸膨胀:a的尺寸会不断增长,远超预期。
- 数据错位与覆盖:由于元素的不断后移,你尝试插入的元素最终会出现在错误的索引位置,或者覆盖掉本应保留的原始数据,因为add是插入操作,而不是替换操作。
这就是为什么在原始问题中,归并排序在元素数量较少时(如3个以下)能正常工作,而当元素数量增多时就会出现问题——因为列表的膨胀和元素的错位在小规模数据上可能不明显或恰好“蒙混过关”,但在大规模数据上就会暴露其根本缺陷。
正确的数据回写方式:使用ArrayList.set()
为了正确地将临时列表中排序好的元素回写到原始列表的指定位置,应该使用ArrayList.set()方法。set(index, element)方法的行为是:替换指定索引处的现有元素。它不会改变列表的尺寸,也不会移动其他元素。
以下是正确的合并实现片段:
// 正确的回写方式 for(j = 0; j< n; j++) { a.set(from+j, b.get(j)); // 正确:使用 set 方法 }
通过使用set(),我们可以确保临时列表b中排序好的元素被精确地放置回原始列表a的正确位置,覆盖掉旧的未排序元素,而不会导致列表尺寸膨胀或数据错位。
完整且优化的归并排序实现
结合上述修正,以下是一个完整且优化的Java归并排序实现示例:
import java.util.ArrayList; import java.util.List; // 推荐使用接口 public class MergeSortExample { /** * 对给定的List进行归并排序。 * * @param a 待排序的List * @param from 排序范围的起始索引(包含) * @param to 排序范围的结束索引(包含) */ public static void mergeSort(List<String> a, int from, int to) { if (from >= to) { // 基本情况:如果只有一个或零个元素,则已经有序 return; } int mid = from + (to - from) / 2; // 避免 (from + to) 溢出 mergeSort(a, from, mid); // 递归排序左半部分 mergeSort(a, mid + 1, to); // 递归排序右半部分 merge(a, from, mid, to); // 合并两个已排序的子序列 } /** * 合并两个有序的子序列。 * * @param a 原始List * @param from 左子序列的起始索引 * @param mid 左子序列的结束索引 * @param to 右子序列的结束索引 */ public static void merge(List<String> a, int from, int mid, int to) { int n = to - from + 1; // 合并后的总元素数量 // 使用List接口声明临时列表,保持一致性 List<String> b = new ArrayList<>(n); // 临时列表,用于存放合并结果 int i1 = from; // 左子序列的当前索引 int i2 = mid + 1; // 右子序列的当前索引 // 比较两个子序列的元素,将较小的放入临时列表b while (i1 <= mid && i2 <= to) { if (a.get(i1).compareTo(a.get(i2)) < 0) { b.add(a.get(i1)); i1++; } else { b.add(a.get(i2)); i2++; } } // 将左子序列剩余的元素全部放入b while (i1 <= mid) { b.add(a.get(i1)); i1++; } // 将右子序列剩余的元素全部放入b while (i2 <= to) { b.add(a.get(i2)); i2++; } // 将临时列表b中的元素回写到原始列表a的正确位置 // 使用 set 方法替换元素,而不是 add 方法插入元素 for (int j = 0; j < n; j++) { a.set(from + j, b.get(j)); } } public static void main(String[] args) { List<String> patients = new ArrayList<>(); patients.add("Charlie"); patients.add("Alice"); patients.add("David"); patients.add("Bob"); patients.add("Eve"); patients.add("Frank"); patients.add("Grace"); patients.add("Heidi"); System.out.println("原始列表: " + patients); // 调用归并排序 mergeSort(patients, 0, patients.size() - 1); System.out.println("排序后列表: " + patients); // 预期输出: [Alice, Bob, Charlie, David, Eve, Frank, Grace, Heidi] } }
编程实践建议
-
面向接口编程:在Java中,推荐使用接口(如List)而非具体的实现类(如ArrayList)来声明变量和方法参数。这样做可以提高代码的灵活性和可维护性,因为你可以在不改变方法签名的情况下,轻松地切换底层的数据结构实现(例如,从ArrayList切换到LinkedList)。
// 推荐 public static void mergeSort(List<String> a, int from, int to) // 而非 // public static void mergeSort(ArrayList<String> a, Integer from, Integer to)
-
避免包装类用于基本类型索引:对于像from, to, mid, j这样的索引变量,使用基本数据类型int通常比使用包装类Integer更高效,因为避免了自动装箱和拆箱的开销。
-
处理复杂数据结构:如果需要对包含多个属性的自定义对象(如Patient对象,其中包含姓名和疾病信息)进行排序,并希望在排序过程中保持这些属性的关联性,可以直接对List
进行排序。这时,你需要为Patient类实现Comparable接口(如果按照自然顺序排序),或者提供一个Comparator(如果需要多种排序方式或自定义比较逻辑)。 // 示例:对Patient对象列表进行排序 class Patient implements Comparable<Patient> { String name; String sickness; public Patient(String name, String sickness) { this.name = name; this.sickness = sickness; } @Override public int compareTo(Patient other) { return this.name.compareTo(other.name); // 按姓名排序 } @Override public String toString() { return name + "(" + sickness + ")"; } } // 在merge方法中,比较 Patient 对象: // if (a.get(i1).compareTo(a.get(i2)) < 0) { ... } // 或者使用 Comparator: // List<Patient> patients; // patients.sort(Comparator.comparing(Patient::getName)); // Java 8+
通过对包含所有相关信息的对象进行排序,可以确保在排序过程中,所有属性都与其所属的对象保持关联,不会出现数据分离或错位的问题。
总结
归并排序作为一种高效的排序算法,其正确实现的关键在于合并(merge)阶段的数据回写。务必使用ArrayList.set()方法来替换原始列表中的元素,而不是错误地使用ArrayList.add()进行插入。遵循面向接口编程的原则,并根据需要为复杂数据类型实现Comparable或Comparator,将有助于构建健壮、高效且易于维护的Java排序代码。