Java 8 Stream：高效统计List中特定字段出现次数的教程-小浪学习网

Java 8 Stream：高效统计List中特定字段出现次数的教程

本教程旨在演示如何利用Java 8 Stream API高效统计列表中特定字段的出现次数。通过将复杂数据结构（如List

>）转换为POJO对象，并结合Collectors.groupingBy和Collectors.counting，可以简洁明了地实现数据分组与计数，极大提升代码的可读性和维护性。

在日常的java开发中，我们经常会遇到需要对集合中的数据进行分类统计的需求。例如，给定一个包含家庭成员信息的列表，我们可能需要统计不同类型成员（如兄弟姐妹、子女、配偶）各自的数量。原始数据可能以list

>的形式存在，其中每个map代表一个成员，键如”add_family_member”、”full_name”等。

数据结构优化：从Map到POJO

虽然List

>能够存储结构化数据，但它缺乏类型安全，且在访问数据时需要依赖字符串键，容易出错且代码可读性差。为了更好地组织和处理数据，强烈建议使用POJO（Plain Old Java Object）类来表示数据实体。

以家庭成员为例，我们可以定义一个FamilyMember类，其属性与数据字段对应：

import java.time.LocalDate;  public class FamilyMember {      private String memberType;     private String fullName;     private LocalDate dateOfBirth;     private String gender;      public FamilyMember(String memberType, String fullName,                          LocalDate dateOfBirth, String gender) {         this.memberType = memberType;         this.fullName = fullName;         this.dateOfBirth = dateOfBirth;         this.gender = gender;     }      // Getters for all fields     public String getMemberType() {         return memberType;     }      public String getFullName() {         return fullName;     }      public LocalDate getDateOfBirth() {         return dateOfBirth;     }      public String getGender() {         return gender;     }      // Setters (optional, depending on immutability needs)     public void setMemberType(String memberType) {         this.memberType = memberType;     }      public void setFullName(String fullName) {         this.fullName = fullName;     }      public void setDateOfBirth(LocalDate dateOfBirth) {         this.dateOfBirth = dateOfBirth;     }      public void setGender(String gender) {         this.gender = gender;     }      @Override     public String toString() {         return "FamilyMember{" +                "memberType='" + memberType + ''' +                ", fullName='" + fullName + ''' +                '}';     } }

使用POJO的好处显而易见：

类型安全：编译时即可发现类型错误。
代码可读性：通过点操作符访问属性，语义清晰。
IDE支持：自动补全、重构等功能更强大。
维护性：更容易理解和修改代码。

Java 8 Stream API核心解决方案

Java 8引入的Stream API提供了一种声明式处理集合数据的方式，使得数据聚合操作变得非常简洁和高效。要统计列表中特定字段的出现次数，我们可以结合使用Collectors.groupingBy()和Collectors.counting()。

立即学习“Java免费学习笔记（深入）”；

Collectors.groupingBy(function classifier)：根据分类函数对流中的元素进行分组。分类函数的返回值将作为结果Map的键。
Collectors.counting()：一个下游收集器，用于计算每个分组中的元素数量。

下面是使用Java 8 Stream API统计家庭成员类型的完整示例：

import java.time.LocalDate; import java.util.Arrays; import java.util.List; import java.util.Map; import java.util.stream.Collectors;  public class TestFamilyMemberCount {      public static void main(String[] args) {         // 1. 创建FamilyMember对象实例         FamilyMember member1 = new FamilyMember("Sibling", "Sibling name",                 LocalDate.of(1990, 12, 12), "Male");         FamilyMember member2 = new FamilyMember("Sibling", "Sibling name2",                 LocalDate.of(1990, 12, 12), "Male");         FamilyMember member3 = new FamilyMember("Sibling", "Sibling name3",                 LocalDate.of(1990, 12, 12), "Male");         FamilyMember member4 = new FamilyMember("Child", "Child name",                 LocalDate.of(2010, 12, 12), "Male");         FamilyMember member5 = new FamilyMember("Child", "Child name2",                 LocalDate.of(2000, 12, 12), "Female");         FamilyMember member6 = new FamilyMember("Spouse", "Spouse name",                 LocalDate.of(1990, 12, 12), "Male");          // 2. 将FamilyMember对象放入列表中         List<FamilyMember> listOfFamilyMember = Arrays.asList(member1, member2,                 member3, member4, member5, member6);          // 3. 使用Stream API进行分组和计数         Map<String, Long> countMembers = listOfFamilyMember.stream()                 .collect(Collectors.groupingBy(FamilyMember::getMemberType,                         Collectors.counting()));          // 4. 打印结果         System.out.println(countMembers);     } }

代码解析：

数据准备：我们首先创建了几个FamilyMember对象实例，模拟真实的家庭成员数据。
创建列表：将这些实例放入一个List中，这是我们将要处理的集合。
获取流：listOfFamilyMember.stream()将列表转换为一个Stream对象，允许我们进行链式操作。
收集器：
- .collect()方法用于执行终端操作，将流中的元素收集到一个结果容器中。
- Collectors.groupingBy(FamilyMember::getMemberType, Collectors.counting())是核心部分。
  - FamilyMember::getMemberType是一个方法引用，它作为分类函数。Stream中的每个FamilyMember对象都会调用getMemberType()方法来获取其成员类型（如”Sibling”、”Child”、”Spouse”），这个返回值将作为最终Map的键。
  - Collectors.counting()是groupingBy的第二个参数，它是一个下游收集器。对于每个分组（即每个成员类型），counting()会计算该分组中元素的数量，这个数量将作为最终Map的值。
结果：操作完成后，countMembers将是一个Map，其中键是成员类型，值是该类型成员的数量。

输出示例：

{Spouse=1, Sibling=3, Child=2}

这清晰地显示了每种家庭成员类型的数量。

注意事项与最佳实践

POJO优先：在处理结构化数据时，优先考虑使用POJO而非原始的Map结构。这不仅提升了代码质量，也为后续的业务逻辑处理提供了更稳健的基础。
Stream API的优势：Java 8 Stream API提供了一种函数式、声明式的数据处理方式，使得代码更加简洁、易读，尤其在处理集合的过滤、映射、聚合等操作时，其表达能力远超传统的循环迭代。
性能考量：Collectors.groupingBy在内部通常会创建一个HashMap来存储中间结果，其性能在大多数情况下是高效的。对于非常大的数据集，Stream API在多核处理器上也可以利用并行流（parallelStream()）来进一步提升性能，但需要注意并行处理可能带来的线程安全和开销问题。
通用性：本教程中统计特定字段出现次数的方法具有通用性，可以应用于任何需要根据某个属性进行分类计数的场景。只需替换FamilyMember为你的数据类，并调整getMemberType为对应的getter方法即可。

总结

通过本教程，我们学习了如何利用Java 8 Stream API中的Collectors.groupingBy和Collectors.counting，结合POJO数据模型，高效且优雅地统计列表中特定字段的出现次数。这种方法不仅代码简洁，而且具有良好的可读性和可维护性，是现代Java开发中处理集合数据聚合的推荐实践。

文章版权归作者所有，未经允许请勿转载。

THE END