python | 线程池面试题
本文總結一下線程池是怎么回事,分以下幾個部分,對哪個部分感興趣,可以直接跳到對應的章節
第一部分:線程池類的結構介紹
第二部分:線程池的使用
第三部分:線程池的創建流程
第四部分:線程池的應用場景
第五部分:線程池相關的面試題
第一部分:線程池類的結構
線程池存在于Java的并發包J.U.C中,線程池可以根據項目靈活控制并發的數目,避免頻繁的創建和銷毀線程,達到線程對象的重用。
下面是線程池的類圖:
1、接口Executor
接口Executor中,只有一個方法,為execute()
2、接口ExecutorService,繼承自Executor
幾個重要的方法:
(1)關閉線程池的方法,有兩種
一個ExecutorService(J.U.C)可以關閉,這將導致它拒絕新的任務。 ExecutorService的兩種關閉線程池的方式,shutdown和shutdownNow方法:
①shutdown():拒收新的任務,立馬關閉正在執行的任務,可能會引起報錯,需要異常捕獲
②shutdownNow():拒收新的任務,等待任務執行完畢,要確保任務里不會有永久等待阻塞的邏輯,否則會導致線程關閉不了
③不是馬上關閉,要想等待線程池關閉,還需要調用waitFermination來阻塞等待
④還有一些業務場景下,需要知道線程池中的任務是否全部執行完成,當我們關閉線程池之后,可以用isTerminated來判斷所有的線程是否執行完成,千萬不要用isShutdown, 它只是返回你是否調用過shutdown的結果
(2)submit()方法
方法submit延伸的方法Executor.execute(Runnable)通過創建并返回一個Future可用于取消執行和/或等待完成。submit()與execute()的一個區別是submit()有返回值,并且能夠處理 異常
3、Executors(J.U.C),提供了6個靜態方法,分別創建6種不同的線程池,六大靜態方法 內部都是直接或間接調用ThreadPoolExecutor類的構造方法創建線程池對象,這六個靜態方法 本身是沒有技術含量的。
| Executors(類) | Executors靜態方法 | 實現類 | 
| newCachedThreadPool | ThreadPoolExecutor | |
| newFixedThreadPool | ThreadPoolExecutor | |
| newSingleThreadExecutor | ThreadPoolExecutor | |
| newScheduledThreadPool | ScheduledThreadPoolExecutor | |
| newSingleThreadScheduledExecutor | ScheduledThreadPoolExecutor | |
| newWorkStealingPool | ForkJoinPool | |
| Executor(接口):只有一個方法execute() | ||
下面介紹常用的四種:
(1)FixedThreadPool
FixedThreadPool的特點:固定池子中線程的個數。使用靜態方法newFixedThreadPool()創建線程池的時候指定線程池個數。
(2)CachedThreadPool(彈性緩存線程池)
CachedThreadPool的特點:用newCachedThreadPool()方法創建該線程池對象,創建之初里面一個線程都沒有,當execute方法或submit方法向線程池提交任務時,會自動新建線程;如果線程池中有空余線程,則不會新建;這種線程池一般最多情況可以容納幾萬個線程,里面的線程空余60s會被回收。
(3)SingleThreadPool(單線程線程池)
SingleThreadPool的特點:池中只有一個線程,如果扔5個任務進來,那么有4個任務將排隊;作用是保證任務的順序執行。
(4)ScheduledThreadpool(定時器線程池)
注意:要用ScheduledExecutorService去創建ScheduledThreadpool,如果用Executor去引用,就只能調用Executor接口中定義的方法;如果用ExecutorService接口去引用,就只能調用ExecutorService接口中定義的方法,無法使用ScheduledExecutorService接口中新增的方法,那么也就失去了這種線程池的意義
第二部分:線程池的使用
第一種方式,構建一個線程池
ExecutorService threadPool = Executors.newFixedThreadPool(10);
第二種方式,使用ThreadPoolExecutor構建一個線程池
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
public class test {
public static void main(String args[]) {
ExecutorService executorService = new ThreadPoolExecutor(5,10,
10,TimeUnit.SECONDS,new ArrayBlockingQueue<Runnable>(5));
executorService.execute(new Runnable() {
@Override
public void run() {
System.out.println("開始執行線程池中的任務");
}
});
}
}
如果只是簡單的想要改變線程名稱的前綴的話可以自定義ThreadFactory來實現,在Executors.new…中有一個ThreadFactory的參數,如果沒有指定則用的是DefaultThreadFactory。
第三種方式,使用工具來創建線程池,Apache的guava中ThreadFactoryBuilder()來創建線程池,不僅可以避免OOM問題,還可以自定義線程名稱,方便出錯時溯源
第三部分:線程池的流程梳理
1、線程池的參數
(1) corePoolSize:核心線程數的大小
(2) maximumPoolSize:最大線程數的大小
(3) keepAliveTime:線程的空閑時間
(4) TimeUnit:空閑時間的單位
(5) workQueue:阻塞隊列
(6) threadFactory:線程工廠
(7) Handler:拒絕策略
參數的詳細說明:
(1) corePoolSize:池子里的線程數的大小,設置allowCoreThreadTimeOut(true)使核心線程數內的線程也可以被回收
(2) maximumPoolSize:當池子里的線程數達到核心線程數的大小,隊列也滿了,可以繼續創建的線程,直到線程數達到maximumPoolSize
(3) keepAliveTime:線程的空閑時間,是跟核心線程數和最大線程數之間的線程相關,這部分線程,當到達規定的空閑時間還沒有獲取到任務,則會被回收
(4) TimeUnit:空閑時間的單位
(5) workQueue:默認支持4種阻塞隊列
①ArrayBlockingQueue,基于數組的有界阻塞隊列,按FIFO排序。新任務進來后,會放到該隊列的隊尾,有界的數組可以防止資源耗盡問題。
②LinkedBlockingQuene,基于鏈表的無界阻塞隊列(其實最大容量為Interger.MAX),按照FIFO排序。由于該隊列的近似無界性,當線程池中線程數量達到corePoolSize 后,再有新任務進來,會一直存入該隊列,而不會去創建新線程直到maxPoolSize,因此使用該工作隊列時,參數maxPoolSize其實是不起作用的。
③SynchronousQuene,一個不緩存任務的阻塞隊列,生產者放入一個任務必須等到消費者取出這個任務。也就是說新任務進來時,不會緩存,而是直接被調度執行該任務, 如果沒有可用線程,則創建新線程,如果線程數量達到maxPoolSize,則執行拒絕策略。
④PriorityBlockingQueue,具有優先級的無界阻塞隊列,優先級通過參數Comparator實現。
(6) threadFactory:線程工廠,用來創建一個新線程時使用的工廠,可以用來設定線程名,是否為daemon線程等
(7) Handler:拒絕策略
①CallerRunsPolicy(直接拒絕任務),該策略下,在調用者線程中直接執行被拒絕任務的run方法,除非線程池已經shutdown,則直接拋棄任務。
②AbortPolicy(直接丟棄任務,并拋異常),該策略下,直接丟棄任務,并拋出RejectedExecutionException異常。
③DiscardPolicy(直接丟棄任務,什么都不做),該策略下,直接丟棄任務,什么都不做。
④DiscardOldestPolicy(嘗試添加新任務),該策略下,拋棄進入隊列最早的那個任務,然后嘗試把這次拒絕的任務放入隊列
2、線程池的運行過程
(1)剛開始運行時,線程池是空的
(2)一個任務進來,檢查池中的線程數量,是否達到corePoolSize,如果沒有達到,則創建線程,執行任務
(3)任務執行完成之后,線程不會銷毀,而是阻塞的等待下一個任務
(4) 又進來一個任務,不是直接使用阻塞的線程,而是檢查線程池中的線程數大小,是否達到corePoolSize,如果沒有達到,則繼續創建新的線程,來執行新的任務,如此往復, 直到線程池中的線程數達到corePoolSize,此時停止創建新的線程
(5)此時,又來新的任務,會選擇線程池中阻塞等待的線程來執行任務,有一個任務進來,喚醒一個線程來執行這個任務,處理完之后,再次阻塞,嘗試在workQueue上獲取下一 個任務,如果線程池中沒有可喚醒的線程,則任務進入workQueue,排隊等待
(6)如果隊列是無界隊列,比如LinkedBlockingQueue,默認最大容量為Integer.MAX,接近于無界,可用無限制的接收任務,如果隊列是有界隊列,比如ArrayBlockingQueue,可限定隊列大小,當線程池中的線程來不及處理,然后,所有的任務都進入隊列,隊列的任務數也達到限定大小,此時,再來新的任務,就會入隊失敗,然后,就會再次嘗試在線程池里創建線程,直到線程數達到maximumPoolSize,停止創建線程
(7)此時,隊列滿了,新的任務無法入隊,創建的線程數也達到了maximumPoolSize,無法再創建新的線程,此時,就會reject掉,使用拒絕策略RejectedExecutionHandler,不讓繼續提交任務,默認的是AbortPolicy策略,拒絕,并拋出異常
(8)超出corePoolSize數創建的那部分線程,是跟空閑時間keepAliveTime相關的,如果超過keepAliveTime時間還獲取不到任務,線程會被銷毀,自動釋放掉
第四部分:線程池的應用場景
1、newSingleThreadExecutor:一個單線程的線程池,可以用于需要保證順序執行的場景,并且只有一個線程在執行。
2、newFixedThreadPool:一個固定大小的線程池,可以用于已知并發壓力的情況下,對線程數做限制。
3、newCachedThreadPool:一個可以無限擴大的線程池,比較適合處理執行時間比較小的任務。
4、newScheduledThreadPool:可以延時啟動,定時啟動的線程池,適用于需要多個后臺線程執行周期任務的場景。
5、newWorkStealingPool:一個擁有多個任務隊列的線程池,可以減少連接數,創建當前可用cpu數量的線程來并行執行。
線程池的實際業務場景:線程池適合單系統的大量的異步任務處理,比如發送短信、保存日志。
第五部分:線程池相關的面試題
1、為什么使用線程池,線程池有什么作用?
線程池,就是一個池子,存放指定數量的線程來執行任務,處理完任務的線程不進行回收,而是阻塞等待下一個任務,避免了頻繁的創建和銷毀線程,達到了線程的重用。
2、如何創建一個線程池?
最常用的,使用ThreadPoolExecutor實現類來創建線程池
3、如何關閉一個線程池?
ExecutorService提供了兩種方法來關閉線程池,shutdown()和shutdownNow()
(1) shutdown:拒收新的任務,立馬關閉正在執行的任務,可能會引起報錯,需要異常捕獲
(2) shutdownNow:拒收新的任務,等待任務執行完畢,要確保任務里不會有永久等待阻塞的邏輯,否則會導致線程關閉不了
不是馬上關閉,要想等待線程池關閉,還需要調用waitFermination來阻塞等待
還有一些業務場景下,需要知道線程池中的任務是否全部執行完成,當我們關閉線程池之后,可以用isTerminated來判斷所有的線程是否執行完成,千萬不要用isShutdown,它只 是返回你是否調用過shutdown的結果
4、submit()和execute()方法的區別?
execute()方法在Executor()接口中,且是接口中唯一的方法
submit()方法在ExecutorService中,ExecutorService接口繼承Executor 接口
execute()方法,開啟線程執行池中的任務
submit()方法,也可以做到execute()的作用,它還可以返回執行結果,它的 功能是提交指定的任務去執行并且返回Future對象(即執行的結果)
submit()和execute()的區別:
1)接收的參數不一樣
2)submit()方法有返回值Future,而execute()方法沒有返回值
3)submit()方法方便處理Exception異常,意思就是,你在task里會拋出checked或者unchecked exception, 而又希望外面的調用者能夠感知這些exception并作出及時的處理,用 submit,通過捕獲Future.get拋出的異常
5、為什么不建議使用Executors創建線程,而使用ThreadPoolExecutor實現類來創建線程?
Executors中FixedThreadPool使用的是LinkedBlockingQueue隊列,近乎于無界,隊列大小默認為Integer.MAX_VALUE,幾乎可以無限制的放任務到隊列中,線程池中數量是固定的,當線程池中線程數量達到corePoolSize,不會再創建新的線程,所有任務都會入隊到workQueue中,線程從workQueue中獲取任務,但這個隊列幾乎永遠不會滿,只要隊列不滿,就不會再去創建新的線程,就跟maximumPoolSize和keepAliveTime沒有關系,此時,如果線程池中的線程處理任務的時間特別長,導致無法處理新的任務,隊列中的任務就會不斷的積壓,這個過程,會導致機器的內存使用不停的飆升,極端情況下會導致JVM OOM,系統就掛了。
總結:Executors中FixedThreadPool指定使用無界隊列LinkedBlockingQueue會導致內存溢出,所以,最好使用ThreadPoolExecutor自定義線程池
換一種問法:線程池中,無界隊列導致的內存飆升問題,同上
6、線程池如何調優
(1)首先,根據不同的需求選擇線程池,如果需要單線程順序執行,使用SingleThreadExecutor,如果已知并發壓力,使用FixedThreadPool,固定線程數的大小,執行時間小的任務,可以使用CachedThreadPool,創建可緩存的線程池,可以無限擴大線程池,可以靈活回收空閑線程,最多可容納幾萬個線程,線程空余60s會被回收,需要后臺執行周期任務的,可以使用ScheduledThreadPool,可以延時啟動和定時啟動線程池,
(2)如何確認線程池的最大線程數目,分CPU密集型和IO密集型,如果是CPU密集型或計算密集型,因為CPU的利用率高,核心線程數可設置為n(核數)+1,如果是IO密集型,CPU利用率不高,可多給幾個線程數,來進行工作,核心線程數可設置為2n(核數)
總結
以上是生活随笔為你收集整理的python | 线程池面试题的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 关于ccflow jflow 工作流引擎
- 下一篇: Gatling 条件判断
