Fork/Join 框架介绍
參考:https://www.infoq.cn/article/fork-join-introduction
1. 什么是 Fork/Join 框架
Fork/Join 框架是 Java7 提供了的一個用于并行執行任務的框架, 是一個把大任務分割成若干個小任務,最終匯總每個小任務結果后得到大任務結果的框架。
我們再通過 Fork 和 Join 這兩個單詞來理解下 Fork/Join 框架,Fork 就是把一個大任務切分為若干子任務并行的執行,Join 就是合并這些子任務的執行結果,最后得到這個大任務的結果。比如計算 1+2+。。+10000,可以分割成 10 個子任務,每個子任務分別對 1000 個數進行求和,最終匯總這 10 個子任務的結果。Fork/Join 的運行流程圖如下:
2. 工作竊取算法
工作竊取(work-stealing)算法是指某個線程從其他隊列里竊取任務來執行。工作竊取的運行流程圖如下:
那么為什么需要使用工作竊取算法呢?假如我們需要做一個比較大的任務,我們可以把這個任務分割為若干互不依賴的子任務,為了減少線程間的競爭,于是把這些子任務分別放到不同的隊列里,并為每個隊列創建一個單獨的線程來執行隊列里的任務,線程和隊列一一對應,比如 A 線程負責處理 A 隊列里的任務。但是有的線程會先把自己隊列里的任務干完,而其他線程對應的隊列里還有任務等待處理。干完活的線程與其等著,不如去幫其他線程干活,于是它就去其他線程的隊列里竊取一個任務來執行。而在這時它們會訪問同一個隊列,所以為了減少竊取任務線程和被竊取任務線程之間的競爭,通常會使用雙端隊列,被竊取任務線程永遠從雙端隊列的頭部拿任務執行,而竊取任務的線程永遠從雙端隊列的尾部拿任務執行。
工作竊取算法的優點是充分利用線程進行并行計算,并減少了線程間的競爭,其缺點是在某些情況下還是存在競爭,比如雙端隊列里只有一個任務時。并且消耗了更多的系統資源,比如創建多個線程和多個雙端隊列。
3. Fork/Join 框架的介紹
我們已經很清楚 Fork/Join 框架的需求了,那么我們可以思考一下,如果讓我們來設計一個 Fork/Join 框架,該如何設計?這個思考有助于你理解 Fork/Join 框架的設計。
第一步分割任務。首先我們需要有一個 fork 類來把大任務分割成子任務,有可能子任務還是很大,所以還需要不停的分割,直到分割出的子任務足夠小。
第二步執行任務并合并結果。分割的子任務分別放在雙端隊列里,然后幾個啟動線程分別從雙端隊列里獲取任務執行。子任務執行完的結果都統一放在一個隊列里,啟動一個線程從隊列里拿數據,然后合并這些數據。
Fork/Join 使用兩個類來完成以上兩件事情:
- ForkJoinTask:我們要使用 ForkJoin 框架,必須首先創建一個 ForkJoin 任務。它提供在任務中執行 fork() 和 join() 操作的機制,通常情況下我們不需要直接繼承 ForkJoinTask 類,而只需要繼承它的子類,Fork/Join 框架提供了以下兩個子類:
- RecursiveAction:用于沒有返回結果的任務。
- RecursiveTask :用于有返回結果的任務。
- ForkJoinPool :ForkJoinTask 需要通過 ForkJoinPool 來執行,任務分割出的子任務會添加到當前工作線程所維護的雙端隊列中,進入隊列的頭部。當一個工作線程的隊列里暫時沒有任務時,它會隨機從其他工作線程的隊列的尾部獲取一個任務。
4. 使用 Fork/Join 框架
讓我們通過一個簡單的需求來使用下 Fork/Join 框架,需求是:計算 1+2+3+4 的結果。
使用 Fork/Join 框架首先要考慮到的是如何分割任務,如果我們希望每個子任務最多執行兩個數的相加,那么我們設置分割的閾值是 2,由于是 4 個數字相加,所以 Fork/Join 框架會把這個任務 fork 成兩個子任務,子任務一負責計算 1+2,子任務二負責計算 3+4,然后再 join 兩個子任務的結果。
因為是有結果的任務,所以必須繼承 RecursiveTask,實現代碼如下:
通過這個例子讓我們再來進一步了解 ForkJoinTask,ForkJoinTask 與一般的任務的主要區別在于它需要實現 compute 方法,在這個方法里,首先需要判斷任務是否足夠小,如果足夠小就直接執行任務。如果不足夠小,就必須分割成兩個子任務,每個子任務在調用 fork 方法時,又會進入 compute 方法,看看當前子任務是否需要繼續分割成孫任務,如果不需要繼續分割,則執行當前子任務并返回結果。使用 join 方法會等待子任務執行完并得到其結果。
5. Fork/Join 框架的異常處理
ForkJoinTask 在執行的時候可能會拋出異常,但是我們沒辦法在主線程里直接捕獲異常,所以 ForkJoinTask 提供了 isCompletedAbnormally() 方法來檢查任務是否已經拋出異常或已經被取消了,并且可以通過 ForkJoinTask 的 getException 方法獲取異常。使用如下代碼:
if(task.isCompletedAbnormally()) {System.out.println(task.getException()); } 復制代碼getException 方法返回 Throwable 對象,如果任務被取消了則返回 CancellationException。如果任務沒有完成或者沒有拋出異常則返回 null。
6. Fork/Join 框架的實現原理
ForkJoinPool 由 ForkJoinTask 數組和 ForkJoinWorkerThread 數組組成,ForkJoinTask 數組負責存放程序提交給 ForkJoinPool 的任務,而 ForkJoinWorkerThread 數組負責執行這些任務。
ForkJoinTask 的 fork 方法實現原理。當我們調用 ForkJoinTask 的 fork 方法時,程序會調用 ForkJoinWorkerThread 的 pushTask 方法異步的執行這個任務,然后立即返回結果。代碼如下:
public final ForkJoinTask fork() { ((ForkJoinWorkerThread) Thread.currentThread()) .pushTask(this); return this; } 復制代碼pushTask 方法把當前任務存放在 ForkJoinTask 數組 queue 里。然后再調用 ForkJoinPool 的 signalWork() 方法喚醒或創建一個工作線程來執行任務。代碼如下:
final void pushTask(ForkJoinTask t) {ForkJoinTask[] q; int s, m;if ((q = queue) != null) { // ignore if queue removedlong u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;UNSAFE.putOrderedObject(q, u, t);queueTop = s + 1; // or use putOrderedIntif ((s -= queueBase) <= 2)pool.signalWork();else if (s == m)growQueue();}} 復制代碼ForkJoinTask 的 join 方法實現原理。Join 方法的主要作用是阻塞當前線程并等待獲取結果。讓我們一起看看 ForkJoinTask 的 join 方法的實現,代碼如下:
public final V join() {if (doJoin() != NORMAL)return reportResult();elsereturn getRawResult(); } private V reportResult() {int s; Throwable ex;if ((s = status) == CANCELLED)throw new CancellationException(); if (s == EXCEPTIONAL && (ex = getThrowableException()) != null)UNSAFE.throwException(ex);return getRawResult(); } 復制代碼首先,它調用了 doJoin() 方法,通過 doJoin() 方法得到當前任務的狀態來判斷返回什么結果,任務狀態有四種:已完成(NORMAL),被取消(CANCELLED),信號(SIGNAL)和出現異常(EXCEPTIONAL)。
- 如果任務狀態是已完成,則直接返回任務結果。
- 如果任務狀態是被取消,則直接拋出 CancellationException。
- 如果任務狀態是拋出異常,則直接拋出對應的異常。
讓我們再來分析下 doJoin() 方法的實現代碼:
private int doJoin() {Thread t; ForkJoinWorkerThread w; int s; boolean completed;if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {if ((s = status) < 0)return s;if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {try {completed = exec();} catch (Throwable rex) {return setExceptionalCompletion(rex);}if (completed)return setCompletion(NORMAL);}return w.joinTask(this);}elsereturn externalAwaitDone();} 復制代碼在 doJoin() 方法里,首先通過查看任務的狀態,看任務是否已經執行完了,如果執行完了,則直接返回任務狀態,如果沒有執行完,則從任務數組里取出任務并執行。如果任務順利執行完成了,則設置任務狀態為 NORMAL,如果出現異常,則紀錄異常,并將任務狀態設置為 EXCEPTIONAL。
7. 參考資料
- JDK1.7 源碼
- http://ifeve.com/fork-join-5/
轉載于:https://juejin.im/post/5ca03a11f265da308c198ec1
總結
以上是生活随笔為你收集整理的Fork/Join 框架介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第四届程序设计竞赛(天梯赛)华南赛区回顾
- 下一篇: 项目实战4—HAProxy实现高级负载均