本文介绍如何使用 Java 中的 map 数据结构和 Stream API 来高效地聚合 List 中具有重复键的元素的数值。通过将 List 转换为 Map,并利用 compute 方法或 toMap 收集器,可以方便地对重复元素的 Amount 和 Quantity 等属性进行累加,最终得到聚合后的结果。
使用 Map 聚合 List 中的重复元素
在处理包含重复元素的 List 时,经常需要将具有相同键的元素的数值进行聚合。例如,一个 List 中包含多个具有相同 Type 的元素,需要将这些元素的 Amount 和 Quantity 属性进行累加。使用 Java 的 Map 数据结构可以高效地解决这个问题。
1. 数据结构设计
首先,定义一个合适的数据结构来表示 List 中的元素。假设每个元素包含 Type(String 类型)、Amount(double 类型)和 Quantity(Integer 类型)三个属性。
record Data(String type, Double amount, Integer quantity) {} record Datav2(Double amount, Integer quantity) {}
这里使用了 Java 16 引入的 record 类型,它是一种简洁的数据类,自动生成构造函数、getter 方法、equals()、hashCode() 和 toString() 方法。Data 用于表示原始数据,Datav2 用于存储聚合后的 Amount 和 Quantity。
立即学习“Java免费学习笔记(深入)”;
2. 使用 compute 方法聚合
如果已经有一个 Map,可以使用 compute 方法来添加或更新元素。compute 方法接受一个键和一个 BiFunction,BiFunction 接受键和当前值(如果存在)作为参数,并返回新的值。
import java.util.HashMap; import java.util.Map; public class AggregateList { public static void main(String[] args) { var map = new HashMap<>(Map.of("A", new Datav2(2.0, 3))); // add element to map equivalent to Data("A", 3.0, 3) map.compute("A", (k, v) -> { if (v == null) { v = new Datav2(0.0, 0); } return new Datav2(3.0, v.quantity() + 3); }); System.out.println(map); // 输出: {A=Datav2[amount=3.0, quantity=6]} } }
在这个例子中,如果键 “A” 存在,则将 Amount 更新为 3.0,并将 Quantity 加上 3。如果键 “A” 不存在,则创建一个新的 Datav2 对象,并将其添加到 Map 中。
3. 使用 Stream API 和 toMap 收集器聚合
如果需要从一个 List 开始,可以使用 Stream API 将 List 转换为 Map,并使用 toMap 收集器进行聚合。
import java.util.List; import java.util.stream.Collectors; public class AggregateList { public static void main(String[] args) { var list = List.of(new Data("A", 2.0, 3), new Data("A", 3.0, 3), new Data("C", 2.0, 1), new Data("B", 10.0, 3), new Data("B", 2.0, 5) ); var collected = list .stream() .collect(Collectors.toMap( // what will the key be Data::type, // what will the value be data -> new Datav2(data.amount(), data.quantity()), // how do we combine two values if they have the same key (d1, d2) -> new Datav2(d1.amount() + d2.amount(), d1.quantity() + d2.quantity()) )); System.out.println(collected); // 输出: {A=Datav2[amount=5.0, quantity=6], B=Datav2[amount=12.0, quantity=8], C=Datav2[amount=2.0, quantity=1]} } }
在这个例子中,toMap 收集器接受三个参数:
- keyMapper: 用于生成 Map 的键。这里使用 Data::type 方法引用,将 Data 对象的 type 属性作为键。
- valueMapper: 用于生成 Map 的值。这里使用 data -> new Datav2(data.amount(), data.quantity()) Lambda 表达式,将 Data 对象的 amount 和 quantity 属性创建一个新的 Datav2 对象作为值。
- mergeFunction: 用于合并具有相同键的值。这里使用 (d1, d2) -> new Datav2(d1.amount() + d2.amount(), d1.quantity() + d2.quantity()) lambda 表达式,将具有相同键的 Datav2 对象的 amount 和 quantity 属性相加,创建一个新的 Datav2 对象作为合并后的值。
注意事项
- 在使用 toMap 收集器时,需要注意处理键冲突的情况。如果没有提供 mergeFunction,当 List 中存在具有相同键的元素时,会抛出 IllegalStateException 异常。
- 如果需要处理大量数据,可以考虑使用并行流来提高性能。
总结
本文介绍了如何使用 Java 中的 Map 数据结构和 Stream API 来高效地聚合 List 中具有重复键的元素的数值。通过将 List 转换为 Map,并利用 compute 方法或 toMap 收集器,可以方便地对重复元素的 Amount 和 Quantity 等属性进行累加,最终得到聚合后的结果。这种方法不仅简洁高效,而且易于理解和维护。