JDK1.8 新增 Collectors groupingBy 方法使用注意事项有哪些

在使用 JDK1.8 的 Collectors.groupingBy 进行集合分组时，最稳妥的做法是先过滤掉分组键为 null 的元素，并根据是否需要排序选择 HashMap 或 LinkedHashMap。

先说结论：groupingBy 是 JDK1.8 中处理集合分组的高效工具，但默认行为存在空指针风险和无序问题，需显式处理。

适合：需要对 List 或 Stream 中的对象按某个属性进行分类汇总的场景。
先看：分组依据的字段（key）是否存在 null 值，这直接决定是否会抛出异常。
建议：若业务依赖分组顺序，请手动传入 LinkedHashMap::new 作为 mapFactory 参数。

核心风险与原理

这主要源于 Java 集合框架的底层实现机制与 Collectors 源码逻辑。

1. 空指针风险：HashMap 本身允许 null 键，但 Collectors.groupingBy 的 accumulator 实现中显式检查了 key 是否为 null，一旦为 null 直接抛出 NullPointerException，提示 element cannot be mapped to a null key。

JDK1.8 新增 Collectors groupingBy 方法使用注意事项有哪些

2. 无序问题：groupingBy 的默认重载方法内部使用的是 HashMap::new 来创建结果容器，而 HashMap 本身不保证插入顺序，因此分组后的 Map 遍历顺序可能是乱的。

完整可运行示例

以下是一个包含数据模型、错误演示及修复方案的完整类，可直接复制运行验证。

import java.util.*;
import java.util.stream.Collectors;

public class GroupingByDemo {

    // 1. 定义数据模型
    public static class User {
        private String category;
        private String name;

        public User(String category, String name) {
            this.category = category;
            this.name = name;
        }

        public String getCategory() { return category; }
        public String getName() { return name; }

        @Override
        public String toString() {
            return "User{category='" + category + "', name='" + name + "'}";
        }
    }

    public static void main(String[] args) {
        List<User> list = Arrays.asList(
            new User("A", "User1"),
            new User(null, "User2"), // 模拟 null 键数据
            new User("B", "User3")
        );

        // 2. 错误写法：直接分组，会抛异常
        try {
            Map<String, List<User>> errorMap = list.stream()
                .collect(Collectors.groupingBy(User::getCategory));
        } catch (NullPointerException e) {
            System.out.println("捕获到异常：" + e.getMessage());
        }

        // 3. 正确写法：先过滤 null 键
        Map<String, List<User>> safeMap = list.stream()
            .filter(u -> u.getCategory() != null)
            .collect(Collectors.groupingBy(User::getCategory));

        System.out.println("分组结果：" + safeMap);
    }
}

异常堆栈与排查

当分组键为 null 时，控制台会输出如下典型堆栈信息，定位问题时请重点关注 Collectors.lambda$groupingBy$ 相关调用。

Exception in thread "main" java.lang.NullPointerException: element cannot be mapped to a null key
	at java.util.Objects.requireNonNull(Objects.java:228)
	at java.util.stream.Collectors.lambda$groupingBy$45(Collectors.java:1092)
	at java.util.stream.ReduceOps$3ReducingSink.accept(ReduceOps.java:169)

顺序验证方法

若业务依赖分组顺序（如按插入时间展示），需验证 Map 实现类。以下代码可验证默认 HashMap 无序，而 LinkedHashMap 有序。

// 构造有序数据
List<User> orderedList = Arrays.asList(
    new User("2023-01", "A"),
    new User("2023-02", "B"),
    new User("2023-03", "C")
);

// 默认 HashMap (顺序可能乱)
Map<String, List<User>> hashMap = orderedList.stream()
    .collect(Collectors.groupingBy(User::getCategory));

// 指定 LinkedHashMap (保持插入顺序)
Map<String, List<User>> linkedMap = orderedList.stream()
    .collect(Collectors.groupingBy(
        User::getCategory,
        LinkedHashMap::new,
        Collectors.toList()
    ));

// 遍历验证
linkedMap.keySet().forEach(key -> System.out.print(key + " "));
// 输出应为：2023-01 2023-02 2023-03

常见坑点总结

1. 分组键为空导致报错：这是最高频的问题。直接对可能为 null 的字段调用 groupingBy 会在运行时抛出 NullPointerException，必须在 collect 之前 filter 掉 null 值。

2. 误以为分组结果有序：很多开发者默认认为 stream 的处理顺序会保留在结果 Map 中，但实际上默认返回 HashMap。如果后续业务依赖这个顺序（如前端展示），必须显式指定 LinkedHashMap。

3. 下游收集器选错：例如想要统计每个分组的数量，却忘了第二个参数默认是 toList()，导致得到的是 Map<K, List<T>> 而不是 Map<K, Long>，后续取值需要额外转换。应使用 groupingBy(classifier, counting())。

参考文档

Oracle JavaDoc - Collectors.groupingBy