java collection api_Java Stream和Collection比较:何时以及如何从Java API返回?
向您展示一些可以非常方便地使用Java Stream流的場(chǎng)景以及如何使用它們的示例。
本文基于標(biāo)準(zhǔn)Java庫(kù)java.util.stream。它既與反應(yīng)流無(wú)關(guān),也與諸如Vavr之類的其他流實(shí)現(xiàn)無(wú)關(guān)。另外,我將不介紹諸如并行執(zhí)行之類的流的高級(jí)細(xì)節(jié)。
首先,讓我們簡(jiǎn)要討論與集合相比獨(dú)特的流功能。盡管存在一些相似之處,但差異是很大的,您不應(yīng)將流僅視為庫(kù)中的另一種集合。
根據(jù)java.util.stream 的文檔,最重要的功能是:沒(méi)有存儲(chǔ)空間,可能是無(wú)限制的 -集合是現(xiàn)成的數(shù)據(jù)結(jié)構(gòu),而流表示產(chǎn)生數(shù)據(jù)的能力,通常在創(chuàng)建流時(shí)甚至不存在。由于不存儲(chǔ)流中的數(shù)據(jù),因此我們可以創(chuàng)建幾乎不確定的流,或者可以更實(shí)際地對(duì)其重新措辭,我們可以讓消費(fèi)者決定要從流中讀取多少個(gè)元素,從生產(chǎn)者的角度來(lái)看,它可能是不確定的(例如new Random().ints())。
懶惰加載 —在定義流時(shí)暫停許多操作(例如過(guò)濾,映射),并且僅在使用者決定使用流中的數(shù)據(jù)時(shí)才執(zhí)行
本質(zhì)上是實(shí)用的 -由于您已經(jīng)具有使用流的經(jīng)驗(yàn),因此您可能會(huì)注意到處理流中的數(shù)據(jù)是為每個(gè)步驟(例如過(guò)濾器或映射)創(chuàng)建新流,而不是修改源數(shù)據(jù)
消耗性 -您只能讀取一次流,然后與可以多次讀取的集合不同,它變?yōu)椤跋男浴?/p>
現(xiàn)在讓我們看看我們可以用流解決什么問(wèn)題。
處理大量數(shù)據(jù)
假設(shè),我們必須將數(shù)據(jù)從外部服務(wù)復(fù)制到我們的數(shù)據(jù)庫(kù)中。要復(fù)制的數(shù)據(jù)量可以任意大。我們無(wú)法獲取所有數(shù)據(jù),無(wú)法將其存儲(chǔ)在一個(gè)集合中,然后保存在數(shù)據(jù)庫(kù)中,因?yàn)檫@可能會(huì)耗盡堆內(nèi)存。我們必須分批處理數(shù)據(jù),并設(shè)計(jì)外部服務(wù)客戶端和數(shù)據(jù)庫(kù)存儲(chǔ)之間的接口。由于流不存儲(chǔ)日期,因此可以使用它安全地處理所需的數(shù)據(jù)量。
在示例(及以下所有示例)中,我們將使用java.util.stream.Stream接口的靜態(tài)方法來(lái)構(gòu)建流。用Java構(gòu)建流的最強(qiáng)大,最靈活的方法是實(shí)現(xiàn)Spliterator接口,然后使用StreamSupport類將其包裝為流。但是,正如我們所看到的,Stream在許多情況下,接口中的靜態(tài)工廠方法就足夠了。
假定一個(gè)簡(jiǎn)單的API從支持分頁(yè)的外部服務(wù)(例如,REST服務(wù),數(shù)據(jù)庫(kù))中獲取數(shù)據(jù)。該API最多可limit從提取項(xiàng)目offset。迭代地使用API??,我們可以根據(jù)需要獲取盡可能多的數(shù)據(jù)
interface ExternalService {
List fetch(int offset, int limit);
}
現(xiàn)在,我們可以使用API??提供數(shù)據(jù)流,并將API的使用者與分頁(yè)API隔離開:
class Service {
private final ExternalService externalService;
public Stream stream(int size, int batchSize) {
var cursor = new Cursor();
return Stream
.generate(() -> next(cursor, size, batchSize))
.takeWhile(not(List::isEmpty))
.flatMap(List::stream);
}private List next(Cursor cursor, int size, int batchSize){
var fetchSize = Math.min(size?-?cursor.offset, batchSize);
var result = externalService.fetch(cursor.offset, fetchSize);
cursor.inc(result.size());
return result;
}
}
Cursor 握有當(dāng)前偏移量offset:
private static class Cursor {
private int offset;
void inc(int by) {
offset += by;
}
我們使用Stream.generate()方法構(gòu)建無(wú)限流,其中每個(gè)元素由流提供者創(chuàng)建。流元素是從REST API獲取的頁(yè)面List。將為每個(gè)流創(chuàng)建Cursor類的實(shí)例,以跟蹤獲取的元素的進(jìn)度。
Stream.takeWhile()方法用于檢測(cè)的最后一頁(yè),最后返回的數(shù)據(jù)流T,而不是List。
我們使用flatMap扁平化流。盡管在某些情況下,保留批處理(例如將整個(gè)頁(yè)面保存在一個(gè)事務(wù)中)可能很有用。
現(xiàn)在,我們可以使用Service.stream(size, batchSize)來(lái)檢索任意長(zhǎng)流,而無(wú)需任何分頁(yè)API的知識(shí)(我們決定公開batchSize參數(shù),但這是一個(gè)設(shè)計(jì)決策)。在任何時(shí)間點(diǎn),內(nèi)存消耗都受到批處理大小的限制。使用者可以一一處理數(shù)據(jù),將其保存在數(shù)據(jù)庫(kù)中,或者再次進(jìn)行批處理(批處理大小可能不同)。
快速訪問(wèn)(不完整)數(shù)據(jù)
假設(shè)我們有一個(gè)耗時(shí)的操作,必須對(duì)數(shù)據(jù)的每個(gè)元素執(zhí)行該操作,并且計(jì)算要花費(fèi)時(shí)間t。對(duì)于n元素,使用者必須等待t * n才能接收到計(jì)算結(jié)果。例如,如果用戶正在等待帶有計(jì)算結(jié)果的表,則可能是一個(gè)問(wèn)題。我們希望在顯示第一結(jié)果時(shí)立即顯示它們,而不是等待所有結(jié)果的計(jì)算并立即提交表。
public class Producer1 {
private Stream buildStream() {
return Stream.of("a", "b", "c"); }private String expensiveStringDoubler(String input){
return input + input;
}public Stream stream(){
return buildStream().map(this::expensiveComputation);
}
}
消費(fèi)者:
stream().forEach(System.out::println)
輸出:
Processing of: a aa Processing of: b …
輸出:
Processing of: a aa Processing of: b …
如我們所見,在開始處理下一個(gè)元素之前,用戶可以使用第一個(gè)元素“ aa ”的處理結(jié)果,但是計(jì)算仍然是流的生產(chǎn)者責(zé)任。換句話說(shuō),消費(fèi)者決定何時(shí)以及是否應(yīng)該執(zhí)行計(jì)算,但是生產(chǎn)者仍然負(fù)責(zé)如何執(zhí)行計(jì)算。
您可能會(huì)認(rèn)為這很容易,并且不需要流。當(dāng)然,您是對(duì)的,讓我們看一下:
public class Producer1Classic {
public List data() {
return List.of("a", "b", "c", "d", "e", "f"); }public String expensiveStringDoubler(String input){
return input + input;
}
}
消費(fèi)者:
var producer = new Producer1Classic();
for (String element : producer.data()) {
System.out.println(producer.expensiveComputation(element));
}
同樣的效果,但是實(shí)際上我們已經(jīng)重新發(fā)明了輪子,我們的實(shí)現(xiàn)模仿了stream的祖先- Iterator并且我們失去了stream的API的優(yōu)勢(shì)。
避免過(guò)早計(jì)算
再次假設(shè)我們要對(duì)每個(gè)流元素執(zhí)行耗時(shí)的操作。在某些情況下,API的使用者無(wú)法提前說(shuō)出需要多少數(shù)據(jù)。例如:用戶取消了數(shù)據(jù)加載
在數(shù)據(jù)處理過(guò)程中發(fā)生錯(cuò)誤,無(wú)需處理其余數(shù)據(jù)
消費(fèi)者讀取數(shù)據(jù)直到滿足條件,例如第一個(gè)正值
由于流的惰性,在這種情況下可以避免一些計(jì)算。
private Stream buildStream() {
return new Random().doubles().boxed();
}private Double expensiveComputation(Double input){
return input / 2;
}public Stream stream(){
return buildStream().map(this::expensiveComputation);
}
消費(fèi)者:
stream().peek(System.out::println).filter(value -> value > 0.4).findFirst();
在該示例中,使用者讀取數(shù)據(jù),直到該值大于0.4。生產(chǎn)者并不了解消費(fèi)者的這種邏輯,但它只計(jì)算必要的項(xiàng)目。邏輯(例如條件)可以在用戶端獨(dú)立更改。
API易于使用
使用流而不是自定義API設(shè)計(jì)還有另一個(gè)原因。流是標(biāo)準(zhǔn)庫(kù)的一部分,并為許多開發(fā)人員所熟知。在我們的API中使用流使其他開發(fā)人員更容易使用該API。
其他注意事項(xiàng)
錯(cuò)誤處理
傳統(tǒng)的錯(cuò)誤處理不適用于Streams。由于實(shí)際處理將推遲到需要時(shí)進(jìn)行,因此構(gòu)造流時(shí)不會(huì)引發(fā)異常?;旧?#xff0c;我們有兩個(gè)選擇:引發(fā)RuntimeException-終止方法(例如forEach)將引發(fā)異常
將元素包裝到一個(gè)對(duì)象中,該對(duì)象表示正在處理的元素的當(dāng)前狀態(tài),例如TryVavr庫(kù)中的特殊類(博客中的詳細(xì)信息)
資源管理
有時(shí)我們必須使用一種資源來(lái)提供流數(shù)據(jù)(例如,外部服務(wù)中的會(huì)話),并且我們想在流處理完成時(shí)將其釋放。幸運(yùn)的是,流實(shí)現(xiàn)了Autoclosable接口,我們可以在try-with-resources語(yǔ)句中使用流,從??而使資源管理變得非常容易。我們要做的就是使用onClose方法在流中注冊(cè)一個(gè)鉤子。當(dāng)流關(guān)閉時(shí),該掛鉤將自動(dòng)被調(diào)用。
private Stream buildStream() {
return new Random().doubles().boxed();
}private Double expensiveComputation(Double input){
if (input > 0.8) throw new RuntimeException("Data processing exception"); return input / 2;
}public Stream stream(){
return buildStream().map(this::expensiveComputation).onClose(()-> System.out.println("Releasing resources…
消費(fèi)者:
try (Stream stream = stream()){
stream.forEach(System.out::println);
}
輸出:
0.2264004802916616
0.32777949557515484
Releasing resources…
Exception in thread “main” java.lang.RuntimeException: Data processing exception
在該示例中,當(dāng)發(fā)生數(shù)據(jù)處理異常時(shí),流將通過(guò)try-with-resources語(yǔ)句自動(dòng)關(guān)閉,并調(diào)用已注冊(cè)的處理程序。在示例輸出中,我們可以看到Releasing resources…處理程序打印的消息。
總結(jié)流不是集合。
流可以幫助我們解決以下問(wèn)題:*處理大量數(shù)據(jù)*快速訪問(wèn)(不完整的)數(shù)據(jù)*避免過(guò)早計(jì)算
構(gòu)建流并不難。
我們必須注意錯(cuò)誤處理。
支持資源管理。
總結(jié)
以上是生活随笔為你收集整理的java collection api_Java Stream和Collection比较:何时以及如何从Java API返回?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
                            
                        - 上一篇: BJUI的应用
 - 下一篇: 【codeforces 239B】Eas