文章詳情頁

Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解

瀏覽：64日期：2022-09-01 11:36:21

本文實(shí)例講述了Java 8 Stream 的終極技巧——Collectors 功能與操作方法。分享給大家供大家參考，具體如下：

1. 前言

昨天在 Collection移除元素操作相關(guān)的文章中提到了 Collectors 。相信很多同學(xué)對(duì)這個(gè)比較感興趣，那我們今天就來研究一下 Collectors 。

2. Collectors 的作用

Collectors 是 Java 8 加入的操作類，位于 java.util.stream 包下。它會(huì)根據(jù)不同的策略將元素收集歸納起來，比如最簡(jiǎn)單常用的是將元素裝入Map、Set、List 等可變?nèi)萜髦?。特別對(duì)于 Java 8 Stream Api 來說非常有用。它提供了collect() 方法來對(duì) Stream 流進(jìn)行終結(jié)操作派生出基于各種策略的結(jié)果集。我們就借助于 Stream 來熟悉一下 Collectors 吧。我們依然用昨天的例子：

List<String> servers = new ArrayList<>(); servers.add('Felordcn'); servers.add('Tomcat'); servers.add('Jetty'); servers.add('Undertow'); servers.add('Resin');3. Java 8 中 Collectors 的方法

Collectors 提供了一系列的靜態(tài)方法供我們使用，通常情況我們靜態(tài)導(dǎo)入即可使用。接下來我們來看看都提供了哪些方法吧。

3.1 類型歸納

這是一個(gè)系列，作用是將元素分別歸納進(jìn)可變?nèi)萜?List、Map、Set、Collection 或者ConcurrentMap 。

Collectors.toList(); Collectors.toMap(); Collectors.toSet(); Collectors.toCollection(); Collectors.toConcurrentMap();

我們可以根據(jù)以上提供的 API 使用 Stream 的 collect 方法中的轉(zhuǎn)換為熟悉的集合容器。非常簡(jiǎn)單這里不再演示。

3.2 joining

將元素以某種規(guī)則連接起來。該方法有三種重載 joining(CharSequence delimiter) 和 joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)

// 輸出 FelordcnTomcatJettyUndertowResin servers.stream().collect(Collectors.joining()); // 輸出 Felordcn,Tomcat,Jetty,Undertow,Resin servers.stream().collect(Collectors.joining(',' )); // 輸出 [Felordcn,Tomcat,Jetty,Undertow,Resin] servers.stream().collect(Collectors.joining(',', '[', ']'));

用的比較多的是讀取 HttpServletRequest 中的 body ：

HttpServletRequest.getReader().lines().collect(Collectors.joining());3.3 collectingAndThen

該方法先執(zhí)行了一個(gè)歸納操作，然后再對(duì)歸納的結(jié)果進(jìn)行 Function 函數(shù)處理輸出一個(gè)新的結(jié)果。

// 比如我們將servers joining 然后轉(zhuǎn)成大寫，結(jié)果為： FELORDCN,TOMCAT,JETTY,UNDERTOW,RESIN servers.stream.collect(Collectors.collectingAndThen(Collectors.joining(','), String::toUpperCase));3.4 groupingBy

按照條件對(duì)元素進(jìn)行分組，和 SQL 中的 group by 用法有異曲同工之妙，通常也建議使用 Java 進(jìn)行分組處理以減輕數(shù)據(jù)庫壓力。groupingBy 也有三個(gè)重載方法我們將 servers 按照長度進(jìn)行分組:

// 按照字符串長度進(jìn)行分組符合條件的元素將組成一個(gè) List 映射到以條件長度為key 的 Map<Integer, List<String>> 中servers.stream.collect(Collectors.groupingBy(String::length))

如果我不想 Map 的 value 為 List 怎么辦？上面的實(shí)現(xiàn)實(shí)際上調(diào)用了下面的方式：

//Map<Integer, Set<String>> servers.stream.collect(Collectors.groupingBy(String::length, Collectors.toSet()))

我要考慮同步安全問題怎么辦？當(dāng)然使用線程安全的同步容器啊，那前兩種都用不成了吧！別急！我們來推斷一下，其實(shí)第二種等同于下面的寫法:

Supplier<Map<Integer,Set<String>>> mapSupplier = HashMap::new; Map<Integer,Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));

這就非常好辦了，我們提供一個(gè)同步 Map 不就行了，于是問題解決了：

Supplier<Map<Integer, Set<String>>> mapSupplier = () -> Collections.synchronizedMap(new HashMap<>()); Map<Integer, Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));

其實(shí)同步安全問題 Collectors 的另一個(gè)方法 groupingByConcurrent 給我們提供了解決方案。用法和 groupingBy 差不多。

3.5 partitioningBy

partitioningBy 我們?cè)诒疚拈_頭的提到的文章中已經(jīng)見識(shí)過了，可以看作 groupingBy 的一個(gè)特例，基于斷言（Predicate）策略分組。這里不再舉例說明。

3.6 counting

該方法歸納元素的的數(shù)量，非常簡(jiǎn)單，不再舉例說明。

3.7 maxBy/minBy

這兩個(gè)方法分別提供了查找大小元素的操作，它們基于比較器接口 Comparator 來比較，返回的是一個(gè) Optional 對(duì)象。我們來獲取 servers 中最小長度的元素:

// Jetty Optional<String> min = servers.stream.collect(Collectors.minBy(Comparator.comparingInt(String::length)));

這里其實(shí) Resin 長度也是最小，這里遵循了 '先入為主' 的原則。當(dāng)然 Stream.min() 可以很方便的獲取最小長度的元素。maxBy 同樣的道理。

3.8 summingInt/Double/Long

用來做累加計(jì)算。計(jì)算元素某個(gè)屬性的總和,類似 Mysql 的 sum 函數(shù)，比如計(jì)算各個(gè)項(xiàng)目的盈利總和、計(jì)算本月的全部工資總和等等。我們這里就計(jì)算一下 servers 中字符串的長度之和（為了舉例不考慮其它寫法）。

// 總長度 32 servers.stream.collect(Collectors.summingInt(s -> s.length()));3.9 summarizingInt/Double/Long

如果我們對(duì) 3.6章節(jié)-3.8章節(jié) 的操作結(jié)果都要怎么辦？難不成我們搞5個(gè) Stream 流嗎？所以就有了 summarizingInt、summarizingDouble、summarizingLong 三個(gè)方法。這三個(gè)方法通過對(duì)元素某個(gè)屬性的提取，會(huì)返回對(duì)元素該屬性的統(tǒng)計(jì)數(shù)據(jù)對(duì)象，分別對(duì)應(yīng) IntSummaryStatistics、DoubleSummaryStatistics、LongSummaryStatistics。我們對(duì) servers 中元素的長度進(jìn)行統(tǒng)計(jì)：

DoubleSummaryStatistics doubleSummaryStatistics = servers.stream.collect(Collectors.summarizingDouble(String::length)); // {count=5, sum=32.000000, min=5.000000, average=6.400000, max=8.000000} System.out.println('doubleSummaryStatistics.toString() = ' + doubleSummaryStatistics.toString());

結(jié)果 DoubleSummaryStatistics 中包含了 總數(shù)，總和，最小值，最大值，平均值 五個(gè)指標(biāo)。

3.10 mapping

該方法是先對(duì)元素使用 Function 進(jìn)行再加工操作，然后用另一個(gè)Collector 歸納。比如我們先去掉 servers 中元素的首字母，然后將它們裝入 List 。

// [elordcn, omcat, etty, ndertow, esin] servers.stream.collect(Collectors.mapping(s -> s.substring(1), Collectors.toList()));

有點(diǎn)類似 Stream 先進(jìn)行了 map 操作再進(jìn)行 collect ：

servers.stream.map(s -> s.substring(1)).collect(Collectors.toList());3.11 reducing

這個(gè)方法非常有用！但是如果要了解這個(gè)就必須了解其參數(shù) BinaryOperator<T> 。這是一個(gè)函數(shù)式接口，是給兩個(gè)相同類型的量，返回一個(gè)跟這兩個(gè)量相同類型的一個(gè)結(jié)果，偽表達(dá)式為 (T,T) -> T。默認(rèn)給了兩個(gè)實(shí)現(xiàn) maxBy 和 minBy ，根據(jù)比較器來比較大小并分別返回最大值或者最小值。當(dāng)然你可以靈活定制。然后 reducing 就很好理解了，元素兩兩之間進(jìn)行比較根據(jù)策略淘汰一個(gè)，隨著輪次的進(jìn)行元素個(gè)數(shù)就是 reduce 的。那這個(gè)有什么用處呢？ Java 官方給了一個(gè)例子：統(tǒng)計(jì)每個(gè)城市個(gè)子最高的人。

Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Map<String, Optional<Person>> tallestByCity = people.stream() .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(BinaryOperator.maxBy(byHeight))));

結(jié)合最開始給的例子你可以使用 reducing 找出最長的字符串試試。

上面這一層是根據(jù) Height 屬性找最高的 Person ，而且如果這個(gè)屬性沒有初始化值或者沒有數(shù)據(jù)，很有可能拿不到結(jié)果所以給出的是 Optional<Person>。如果我們給出了 identity 作一個(gè)基準(zhǔn)值，那么我們首先會(huì)跟這個(gè)基準(zhǔn)值進(jìn)行 BinaryOperator 操作。比如我們給出高于 2 米的人作為 identity。我們就可以統(tǒng)計(jì)每個(gè)城市不低于 2 米而且最高的那個(gè)人，當(dāng)然如果該城市沒有人高于 2 米則返回基準(zhǔn)值identity ：

Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Person identity= new Person(); identity.setHeight(2.); identity.setName('identity'); Map<String, Person> collect = persons.stream() .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, BinaryOperator.maxBy(byHeight))));

這時(shí)候就確定一定會(huì)返回一個(gè) Person 了，最起碼會(huì)是基準(zhǔn)值identity 不再是 Optional 。

還有些情況，我們想在 reducing 的時(shí)候把 Person 的身高先四舍五入一下。這就需要我們做一個(gè)映射處理。定義一個(gè) Function<? super T, ? extends U> mapper 來干這個(gè)活。那么上面的邏輯就可以變更為：

Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Person identity = new Person(); identity.setHeight(2.); identity.setName('identity'); // 定義映射處理四舍五入 Function<Person, Person> mapper = ps -> { Double height = ps.getHeight(); BigDecimal decimal = new BigDecimal(height); Double d = decimal.setScale(1, BigDecimal.ROUND_HALF_UP).doubleValue(); ps.setHeight(d); return ps; }; Map<String, Person> collect = persons.stream().collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, mapper, BinaryOperator.maxBy(byHeight))));4. 總結(jié)

今天我們對(duì) Java 8 中的 Collectors 進(jìn)行了詳細(xì)的講解。如果你熟悉了 Collectors 操作 Stream 會(huì)更加得心應(yīng)手。當(dāng)然在 Java 8 之后的 Java 9 和 Java 12 中 Collectors 都有新增的功能，后面有時(shí)間我們會(huì)繼續(xù)進(jìn)行講解。敬請(qǐng)關(guān)注！

更多關(guān)于java算法相關(guān)內(nèi)容感興趣的讀者可查看本站專題：《Java文件與目錄操作技巧匯總》、《Java數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Java操作DOM節(jié)點(diǎn)技巧總結(jié)》和《Java緩存操作技巧匯總》

希望本文所述對(duì)大家java程序設(shè)計(jì)有所幫助。

Java

上一條：詳解java CountDownLatch和CyclicBarrier在內(nèi)部實(shí)現(xiàn)和場(chǎng)景上的區(qū)別下一條：Java修改PowerPoint幻燈片批注信息

相關(guān)文章：

1. python 如何在 Matplotlib 中繪制垂直線2. bootstrap select2 動(dòng)態(tài)從后臺(tái)Ajax動(dòng)態(tài)獲取數(shù)據(jù)的代碼3. ASP常用日期格式化函數(shù) FormatDate()4. python中@contextmanager實(shí)例用法5. html中的form不提交（排除）某些input 原創(chuàng)6. CSS3中Transition屬性詳解以及示例分享7. js select支持手動(dòng)輸入功能實(shí)現(xiàn)代碼8. 如何通過python實(shí)現(xiàn)IOU計(jì)算代碼實(shí)例9. 開發(fā)效率翻倍的Web API使用技巧10. vue使用moment如何將時(shí)間戳轉(zhuǎn)為標(biāo)準(zhǔn)日期時(shí)間格式

排行榜

					
					Python數(shù)據(jù)相關(guān)系數(shù)矩陣和熱力圖輕松實(shí)現(xiàn)教程
如何在PHP中讀寫文件
vue-drag-chart 拖動(dòng)/縮放圖表組件的實(shí)例代碼
PHP正則表達(dá)式函數(shù)preg_replace用法實(shí)例分析
如何使用repr調(diào)試python程序
php redis setnx分布式鎖簡(jiǎn)單原理解析
Java xml數(shù)據(jù)格式返回實(shí)現(xiàn)操作
Spring @Primary和@Qualifier注解原理解析
Django使用channels + websocket打造在線聊天室
Spring Boot 功能整合的實(shí)現(xiàn)
一個(gè) 2 年 Android 開發(fā)者的 18 條忠告