Java Stream API：将列表中的嵌套列表数据分组映射为Map-小浪学习网

Java Stream API：将列表中的嵌套列表数据分组映射为Map

本教程详细阐述了如何利用Java 8及更高版本的Stream API，将包含嵌套列表（如List中包含List)的数据结构，高效地转换为以嵌套对象属性（如员工ID）为键、外部对象列表为值的map>。核心方法涉及使用辅助记录（或类）扁平化流，并结合flatMap、Collectors.groupingBy和Collectors.mapping实现复杂数据聚合。

1. 问题背景与挑战

在处理复杂数据结构时，我们经常遇到需要根据嵌套对象（如列表中的列表）的属性来对外部对象进行分组的需求。例如，给定一个trip对象列表，每个trip包含一个employee对象列表，目标是创建一个map>，其中键是员工id (empid)，值是该员工参与的所有trip列表。

直接尝试使用Collectors.groupingBy对Trip流进行分组，并尝试从Trip中获取员工ID列表作为键，通常会导致编译错误或不符合预期的结果。这是因为groupingBy期望一个单一的、可作为键的值，而不是一个流或列表。例如，将t.getEmpList().stream().map(Employee::getEmpId)作为groupingBy的分类函数，会导致键类型为Stream，而非所需的String。

2. 解决方案核心思路：扁平化与辅助对象

解决此问题的关键在于：

扁平化流： 将Stream转换为一个更细粒度的流，其中每个元素能够直接关联到员工ID和对应的Trip。
辅助对象： 引入一个临时的数据结构（如Java 16的record或一个简单的POJO类），用于将每个Employee的empId与其所属的Trip实例进行绑定。

通过这种方式，我们可以将“一个Trip包含多个Employee”的“一对多”关系，转换为“一个TripEmployee实例代表一个员工在一次行程中的参与”，从而使得后续的分组操作变得简单明了。

3. 定义数据模型

首先，我们定义问题中涉及的领域模型：

立即学习“Java免费学习笔记（深入）”；

import lombok.AllArgsConstructor; import lombok.Data; import lombok.NoArgsConstructor;  import java.util.Date; import java.util.List;  @Data @NoArgsConstructor @AllArgsConstructor public class Trip {     private Date startTime;     private Date endTime;     List<Employee> empList; }  @Data @NoArgsConstructor @AllArgsConstructor public class Employee {     private String name;     private String empId; }

为了辅助分组，我们引入一个record（Java 16+）或一个简单的类来关联员工ID和行程：

// 使用Java 16+ 的 record public record TripEmployee(String empId, Trip trip) {}  // 对于Java 8-15，可以使用一个普通的类 /* public class TripEmployee {     private String empId;     private Trip trip;      public TripEmployee(String empId, Trip trip) {         this.empId = empId;         this.trip = trip;     }      public String getEmpId() { return empId; }     public Trip getTrip() { return trip; }     // 可以根据需要添加equals, hashCode, toString } */

record的优势在于其简洁性，编译器会自动生成构造函数、访问器、equals()、hashCode()和toString()方法。

4. 使用Stream API进行数据转换与分组

核心的Stream管道将分为两步：

4.1 步骤一：扁平化流 (flatMap)

我们首先将Stream扁平化为Stream。对于每个Trip，我们遍历其内部的empList，为每个Employee创建一个TripEmployee实例，将员工ID与当前Trip关联起来。

trips.stream()     .flatMap(trip -> trip.getEmpList().stream() // 将每个Trip的empList转换为Stream<Employee>         .map(emp -> new TripEmployee(emp.getEmpId(), trip)) // 将每个Employee映射为TripEmployee     )     // 此时流的类型为 Stream<TripEmployee>

flatMap操作在这里至关重要，它将一个Stream>（由map操作生成）扁平化为一个单一的Stream。

4.2 步骤二：分组聚合 (groupingBy 与 mapping)

在得到Stream之后，我们就可以使用Collectors.groupingBy进行分组。

分类函数： TripEmployee::empId，这会根据empId进行分组。
下游收集器： 由于我们希望每个empId对应一个List，而当前流中的元素是TripEmployee，我们需要使用Collectors.mapping来提取Trip对象。mapping收集器需要一个映射函数（TripEmployee::trip）和一个最终的下游收集器（Collectors.toList()）来将提取出的Trip收集成列表。

    .collect(Collectors.groupingBy(         TripEmployee::empId, // 根据empId进行分组         Collectors.mapping(TripEmployee::trip, // 将TripEmployee映射为Trip             Collectors.toList()) // 将映射后的Trip收集为List     ));

5. 完整示例代码

以下是包含数据初始化和完整Stream管道的示例：

import lombok.AllArgsConstructor; import lombok.Data; import lombok.NoArgsConstructor;  import java.util.ArrayList; import java.util.Date; import java.util.List; import java.util.Map; import java.util.stream.Collectors;  // 假设 Trip 和 Employee 类已定义如上  // 辅助记录 (Java 16+) public record TripEmployee(String empId, Trip trip) {}  public class TripGroupingExample {      public static void main(String[] args) {         // 示例数据         Employee emp1 = new Employee("Alice", "E001");         Employee emp2 = new Employee("Bob", "E002");         Employee emp3 = new Employee("Charlie", "E003");          Trip trip1 = new Trip(new Date(), new Date(), List.of(emp1, emp2));         Trip trip2 = new Trip(new Date(), new Date(), List.of(emp1, emp3));         Trip trip3 = new Trip(new Date(), new Date(), List.of(emp2));         Trip trip4 = new Trip(new Date(), new Date(), List.of(emp3, emp1)); // 再次包含emp1          List<Trip> trips = new ArrayList<>();         trips.add(trip1);         trips.add(trip2);         trips.add(trip3);         trips.add(trip4);          // 使用Stream API生成Map<String, List<Trip>>         Map<String, List<Trip>> empTripsMap = trips.stream()             .flatMap(trip -> trip.getEmpList().stream() // 将每个Trip的empList扁平化为Stream<Employee>                 .map(emp -> new TripEmployee(emp.getEmpId(), trip)) // 将每个Employee映射为TripEmployee             )             .collect(Collectors.groupingBy(                 TripEmployee::empId, // 根据TripEmployee的empId进行分组                 Collectors.mapping(TripEmployee::trip, // 将TripEmployee映射回Trip                     Collectors.toList()) // 将映射后的Trip收集为List             ));          // 打印结果         empTripsMap.forEach((empId, tripList) -> {             System.out.println("Employee ID: " + empId);             tripList.forEach(trip -> System.out.println("  - Trip: " + trip));             System.out.println("---");         });          /* 预期输出示例 (具体Trip对象内容取决于toString实现和日期)         Employee ID: E001           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip1           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip2           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip4         ---         Employee ID: E002           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip1           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip3         ---         Employee ID: E003           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip2           - Trip: Trip(startTime=..., endTime=..., empList=...) // trip4         ---         */     } }

6. 注意事项与总结

Java版本兼容性： 示例中使用了Java 16的record，如果您的项目使用Java 8到Java 15，请使用普通的Java类作为辅助对象（如代码注释中所示）。功能上没有区别，只是record提供了更简洁的语法。
flatMap的重要性： flatMap是处理“一对多”转换的关键操作。它将流中的每个元素映射到一个新的流，然后将这些新的流连接（扁平化）成一个单一的流。在本例中，它将每个Trip转换为多个TripEmployee实例的流，然后合并这些流。
groupingBy与mapping组合： 当需要根据一个属性分组，但最终值是原始对象或其转换形式的列表时，Collectors.groupingBy结合Collectors.mapping是一个非常强大的模式。mapping允许你在分组之后，对每个组内的元素进行进一步的转换和收集。
可读性： 引入TripEmployee这样的辅助对象，虽然增加了一个小类，但显著提高了Stream管道的可读性和意图清晰度，避免了使用Map.Entry等通用但语义不明确的结构。

通过上述方法，我们能够高效且清晰地利用Java Stream API解决从嵌套列表中提取数据并进行复杂分组的问题，使得代码更具表达力和维护性。

文章版权归作者所有，未经允许请勿转载。

THE END