

新闻资讯
常见问题java8引入了stream,Collector是与stream一起出现的,配合stream使用的好帮手,如果用过stream,我们应该都有写过这样的代码

例子1:
lists.stream()....collect(Collectors.toList());
例子2:
lists.stream().collect(groupingBy(String::length));
这两个例子中,toList()和groupingBy()返回的都是一个Collector对象,那么问题来了,什么是Collector?
Collector其实是一个泛型接口,通过这个接口可以定义一系列的聚合操作,按照官方文档的说法,Collector其实是提供mutable reduction operation,即可改变的减少操作。
常见的聚合操作有:
1.用StringBuilder拼接字符串
2.计算元素综合的数据,比如sum, min, max, or average
这个reduction在Google翻译是减少的意思,但是我不太对得上这个意思,觉得形容成聚合操作会更容易理解一点。
关于聚合操作,我们会在很多语言中遇到,比如mysql里面的group by操作,sum(),min(),max(),Count(),anyValue(),这些叫做aggregate function,即聚合操作
我理解这些操作的是类似的,只不过这些是在数据库里面进行的,collector是在java代码层进行的,他们的本质都是一样的,他们都进行了多对一的转换,将一系列的数据变成一个数据或者几团数据。
Collector是一个接口,它还有一个静态工具类Collectors,Collectors提供了很多常见的聚合操作的实现,通常来说我们调用Collectors里面的方法就够了,如果想要更多更复杂的实现也可以自定义一个collector,定义Collector的话,我们需要先了解Collector的组成
collector是一个泛型接口,那我们先从泛型的元素开始分析
Collector<T, A, R>
这个接口有三种类型,T代表流中元素的类型,A是中间结果容器的类型,R是最后返回的类型
比如一个字符串数组strings,对它进行这个操作
strings.stream()....collect(Collectors.toList());
toList()方法返回的Collector中,T就是String类型,A是List<String>类型,R是List<String>类型,如果不能理解可以继续往下看
collector由四个方法组成和一个特性组成
| 组成 | 作用 |
|---|---|
| Supplier | 创建一个新的结果容器 |
| accumulator | 将一个新的元素(流中的元素)加入到结果容器中 |
| combiner | 接受两个中间的结果容器,将它们合并成一个(并行流的时候) |
| finisher | 将结果容器转换成另一个类型(可选的) |
characteristics 是一个枚举特性集合,决定某些操作过程的特性,比如是否是并行的,是否需要转换结果容器,是否是有序的,这些特性用来进行简化操作,提供更好的性能。
一共有三个特性,在定义的时候可以选几个来组成这个集合,它们是:
关于Collector的四个方法,这里用一个流程图来解释这个过程
下面通过Collectors里面提供的常见方法来详细地说明Collector的组成
首先来看toList()方法的组成
public static <T> Collector<T, ?, List<T>> toList() {
return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
(left, right) -> { left.addAll(right); return left; },
CH_ID);
}
对于这个方法实现来说
(intermediateCollector, item) -> intermediateCollector.add(item)
(left, right) -> { left.addAll(right); return left;}
Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH));
IDENTITY_FINISH这个特性是说,不执行finisher函数,直接返回combiner之后的结果容器
joining有三个方法重载,我们这里先看最直观的一个,它的实现是
public static Collector<CharSequence, ?, String> joining() {
return new CollectorImpl<CharSequence, StringBuilder, String>(
StringBuilder::new, StringBuilder::append,
(r1, r2) -> { r1.append(r2); return r1; },
StringBuilder::toString, CH_NOID);
}
() -> new StringBuilder();
容器A的类型是StringBuilder
(intermediate, current)-> intermediare.append(current);
(r1, r2) -> { r1.append(r2); return r1; }
即对于两个中间的结果stringBuilder来说,combiner做的事情就是合并两个stringBuilder,变成一个stringBuilder
Collections.emptySet();