「递归」的正确打开方式,看不懂你打我~
這是磊哥的第 189 期分享
作者 | 田小齊
來源 | 碼農(nóng)田小齊(ID:NYCSDE)?
分享?| Java中文社群(ID:javacn666)
前言
遞歸,是一個(gè)非常重要的概念,也是面試中非常喜歡考的。因?yàn)樗坏芸疾煲粋€(gè)程序員的算法功底,還能很好的考察對(duì)時(shí)間空間復(fù)雜度的理解和分析。
本文只講一題,也是幾乎所有算法書講遞歸的第一題,但力爭(zhēng)講出花來,在這里分享四點(diǎn)不一樣的角度,讓你有不同的收獲。
時(shí)空復(fù)雜度的詳細(xì)分析
識(shí)別并簡(jiǎn)化遞歸過程中的重復(fù)運(yùn)算
披上羊皮的狼
適當(dāng)炫技助我拿到第一份工作
算法思路
大家都知道,一個(gè)方法自己調(diào)用自己就是遞歸,沒錯(cuò),但這只是對(duì)遞歸最表層的理解。
那么遞歸的實(shí)質(zhì)是什么?
答:遞歸的實(shí)質(zhì)是能夠把一個(gè)大問題分解成比它小點(diǎn)的問題,然后我們拿到了小問題的解,就可以用小問題的解去構(gòu)造大問題的解。
那小問題的解是如何得到的?
答:用再小一號(hào)的問題的解構(gòu)造出來的,小到不能再小的時(shí)候就是到了零號(hào)問題的時(shí)候,也就是 base case 了。
那么總結(jié)一下遞歸的三個(gè)步驟:
Base case:就是遞歸的零號(hào)問題,也是遞歸的終點(diǎn),走到最小的那個(gè)問題,能夠直接給出結(jié)果,不必再往下走了,否則,就會(huì)成死循環(huán);
拆解:每一層的問題都要比上一層的小,不斷縮小問題的 size,才能從大到小到 base case;
組合:得到了小問題的解,還要知道如何才能構(gòu)造出大問題的解。
所以每道遞歸題,我們按照這三個(gè)步驟來分析,把這三個(gè)問題搞清楚,代碼就很容易寫了。
斐波那契數(shù)列
這題雖是老生常談了,但相信我這里分享的一定會(huì)讓你有其他收獲。
題目描述
斐波那契數(shù)列是一位意大利的數(shù)學(xué)家,他閑著沒事去研究兔子繁殖的過程,研究著就發(fā)現(xiàn),可以寫成這么一個(gè)序列:1,1,2,3,5,8,13,21… 也就是每個(gè)數(shù)等于它前兩個(gè)數(shù)之和。那么給你第 n 個(gè)數(shù),問 F(n) 是多少。
解析
用數(shù)學(xué)公式表示很簡(jiǎn)單:
代碼也很簡(jiǎn)單,用我們剛總結(jié)的三步:
base case: f(0) = 0, f(1) = 1.
分解:f(n-1), f(n-2)
組合:f(n) = f(n-1) + f(n-2)
那么寫出來就是:
class?Solution?{public?int?fib(int?N)?{if?(N?==?0)?{return?0;}?else?if?(N?==?1)?{return?1;}return?fib(N-1)?+?fib(N-2);} }但是這種解法 Leetcode 給出的速度經(jīng)驗(yàn)只比 15% 的答案快,因?yàn)?#xff0c;它的時(shí)間復(fù)雜度實(shí)在是太高了!
過程分析
那這就是我想分享的第一點(diǎn),如何去分析遞歸的過程。
首先我們把這顆 Recursion Tree 畫出來,比如我們把 F(5) 的遞歸樹畫出來:
那實(shí)際的執(zhí)行路線是怎樣的?
首先是沿著最左邊這條線一路到底:F(5) → F(4) → F(3) → F(2) → F(1),好了終于有個(gè) base case 可以返回 F(1) = 1 了,然后返回到 F(2) 這一層,再往下走,就是 F(0),又觸底反彈,回到 F(2),得到 F(2) = 1+0 =1 的結(jié)果,把這個(gè)結(jié)果返回給 F(3),然后再到 F(1),拿到結(jié)果后再返回 F(3) 得到 F(3) = 左 + 右 = 2,再把這個(gè)結(jié)果返上去...
這種方式本質(zhì)上是由我們計(jì)算機(jī)的馮諾伊曼體系造就的,目前一個(gè) CPU 一個(gè)核在某一時(shí)間只能執(zhí)行一條指令,所以不能 F(3) 和 F(4) 一起進(jìn)行了,一定是先執(zhí)行了 F(4) (本代碼把 fib(N-1) 放在前面),再去執(zhí)行 F(3).
我們?cè)?IDE 里 debug 就可以看到棧里面的情況:這里確實(shí)是先走的最左邊這條線路,一共有 5 層,然后再一層層往上返回。
沒看懂的小伙伴可以看視頻講解哦~
時(shí)間復(fù)雜度分析
如何評(píng)價(jià)一個(gè)算法的好壞?
很多問題都有多種解法,畢竟條條大路通羅馬。但如何評(píng)價(jià)每種方法的優(yōu)劣,我們一般是用大 O 表達(dá)式來衡量時(shí)間和空間復(fù)雜度。
時(shí)間復(fù)雜度:隨著自變量的增長(zhǎng),算法所需時(shí)間的增長(zhǎng)情況。
這里大 O 表示的是一個(gè)算法在 worst case 的表現(xiàn)情況,這就是我們最關(guān)心的,不然春運(yùn)搶車票的時(shí)候系統(tǒng) hold 不住了,你跟我說這個(gè)算法很優(yōu)秀?
當(dāng)然還有其他衡量時(shí)間和空間的方式,比如
Theta: 描述的是 tight bound
Omega(n): 這個(gè)描述的是 best case,最好的情況,沒啥意義
這也給我們了些許啟發(fā),不要說你平時(shí)表現(xiàn)有多好,沒有意義;面試衡量的是你在 worst case 的水平;不要說面試沒有發(fā)揮出你的真實(shí)水平,扎心的是那就是我們的真實(shí)水平。
那對(duì)于這個(gè)題來說,時(shí)間復(fù)雜度是多少呢?
答:因?yàn)槲覀兠總€(gè)節(jié)點(diǎn)都走了一遍,所以是把所有節(jié)點(diǎn)的時(shí)間加起來就是總的時(shí)間。
在這里,我們?cè)诿總€(gè)節(jié)點(diǎn)上做的事情就是相加求和,是 O(1) 的操作,且每個(gè)節(jié)點(diǎn)的時(shí)間都是一樣的,所以:
總時(shí)間 = 節(jié)點(diǎn)個(gè)數(shù) * 每個(gè)節(jié)點(diǎn)的時(shí)間
那就變成了求節(jié)點(diǎn)個(gè)數(shù)的數(shù)學(xué)題:
在 N = 5 時(shí),
最上面一層有1個(gè)節(jié)點(diǎn),
第二層 2 個(gè),
第三層 4 個(gè),
第四層 8 個(gè),
第五層 16 個(gè),如果填滿的話,想象成一顆很大的樹:)
這里就不要在意這個(gè)沒填滿的地方了,肯定是會(huì)有差這么幾個(gè) node,但是大 O 表達(dá)的時(shí)間復(fù)雜度我們剛說過了,求的是 worst case.
那么總的節(jié)點(diǎn)數(shù)就是:
1 + 2 + 4 + 8 + 16
這就是一個(gè)等比數(shù)列求和了,當(dāng)然你可以用數(shù)學(xué)公式來算,但還有個(gè)小技巧可以幫助你快速計(jì)算:
其實(shí)前面每一層的節(jié)點(diǎn)相加起來的個(gè)數(shù)都不會(huì)超過最后一層的節(jié)點(diǎn)的個(gè)數(shù),總的節(jié)點(diǎn)數(shù)最多也就是最后一層節(jié)點(diǎn)數(shù) * 2,然后在大 O 的時(shí)間復(fù)雜度里面常數(shù)項(xiàng)也是無所謂的,所以這個(gè)總的時(shí)間復(fù)雜度就是:
最后一層節(jié)點(diǎn)的個(gè)數(shù):2^n
沒看懂?別慌,去 B 站/油管看我的視頻講解哦,搜「田小齊」就好了。
空間復(fù)雜度分析
一般書上寫的空間復(fù)雜度是指:
算法運(yùn)行期間所需占用的所有內(nèi)存空間
但是在公司里大家常用的,也是面試時(shí)問的指的是
Auxiliary space complexity:
運(yùn)行算法時(shí)所需占用的額外空間。
舉例說明區(qū)別:比如結(jié)果讓你輸出一個(gè)長(zhǎng)度為 n 的數(shù)組,那么這 O(n) 的空間是不算在算法的空間復(fù)雜度里的,因?yàn)檫@個(gè)空間是跑不掉的,不是取決于你的算法的。
那空間復(fù)雜度怎么分析呢?
我們剛剛說到了馮諾伊曼體系,從圖中也很容易看出來,是最左邊這條路線占用 stack 的空間最多,一直不斷的壓棧,也就是從 5 到 4 到 3 到 2 一直壓到 1,才到 base case 返回,每個(gè)節(jié)點(diǎn)占用的空間復(fù)雜度是 O(1),所以加起來總的空間復(fù)雜度就是 O(n).
我在上面????的視頻里也提到了,不懂的同學(xué)往上翻看視頻哦~
優(yōu)化算法
那我們就想了,為什么這么一個(gè)簡(jiǎn)簡(jiǎn)單單的運(yùn)算竟然要指數(shù)級(jí)的時(shí)間復(fù)雜度?到底是為什么讓時(shí)間如此之大。
那也不難看出來,在這棵 Recursion Tree 里,有太多的重復(fù)計(jì)算了。
比如一個(gè) F(2) 在這里都被計(jì)算了 3 次,F(3) 被計(jì)算了 2 次,每次還都要再重新算,這不就是狗熊掰棒子嗎,真的是一把辛酸淚。
那找到了原因之后,為了解決這種重復(fù)計(jì)算,計(jì)算機(jī)采用的方法其實(shí)和我們?nèi)祟愂且粯拥?#xff1a;記筆記。
對(duì)很多職業(yè)來說,比如醫(yī)生、律師、以及我們工程師,為什么越老經(jīng)驗(yàn)值錢?因?yàn)槲覀円姷枚喾e累的多,下次再遇到類似的問題時(shí),能夠很快的給出解決方案,哪怕一時(shí)解決不了,也避免了一些盲目的試錯(cuò),我們會(huì)站在過去的高度不斷進(jìn)步,而不是每次都從零開始。
回到優(yōu)化算法上來,那計(jì)算機(jī)如何記筆記呢?
我們要想求 F(n),無非也就是要
記錄 F(0) ~ F(n-1) 的值,
那選取一個(gè)合適的數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)就好了。
那這里很明顯了,可以用一個(gè)數(shù)組來存:
| F(n) | 0 | 1 | 1 | 2 | 3 | 5 |
那有了這個(gè) cheat sheet,我們就可以從前到后得到結(jié)果了,這樣每一個(gè)點(diǎn)就只算了一遍,用一個(gè) for loop 就可以寫出來,代碼也非常簡(jiǎn)單。
class?Solution?{public?int?fib(int?N)?{if?(N?==?0)?{return?0;}if?(N==?1)?{return?1;}int[]?notes?=?new?int[N+1];notes[0]?=?0;notes[1]?=?1;for(int?i?=?2;?i?<=?N;?i++)?{notes[i]?=?notes[i-1]?+?notes[i-2];}return?notes[N];} }這個(gè)速度就是 100% 了~
但是我們可以看到,空間應(yīng)該還有優(yōu)化的余地。
那仔細(xì)想想,其實(shí)我們記筆記的時(shí)候需要記錄這么多嗎?需要從幼兒園到小學(xué)到初中到高中的筆記都留著嗎?
那其實(shí)每項(xiàng)的計(jì)算只取決于它前面的兩項(xiàng),所以只用保留這兩個(gè)就好了。
那我們可以用一個(gè)長(zhǎng)度為 2 的數(shù)組來計(jì)算,或者就用 2 個(gè)變量。
更新代碼:
class?Solution?{public?int?fib(int?N)?{int?a?=?0;int?b?=?1;if(N?==?0)?{return?a;}if(N?==?1)?{return?b;}for(int?i?=?2;?i?<=?N;?i++)?{int?tmp?=?a?+?b;a?=?b;b?=?tmp;}return?b;} }這樣我們就把空間復(fù)雜度優(yōu)化到了 O(1),時(shí)間復(fù)雜度和用數(shù)組記錄一樣都是 O(n).
這種方法其實(shí)就是動(dòng)態(tài)規(guī)劃 Dynamic Programming,寫出來的代碼非常簡(jiǎn)單。
那我們比較一下 Recursion 和 DP:
Recursion 是從大到小,層層分解,直到 base case 分解不了了再組合返回上去;
DP 是從小到大,記好筆記,不斷進(jìn)步。
也就是 Recursion + Cache = DP
如何記錄這個(gè)筆記,如何高效的記筆記,這是 DP 的難點(diǎn)。
有人說 DP 是拿空間換時(shí)間,但我不這么認(rèn)為,這道題就是一個(gè)很好的例證。
在用遞歸解題時(shí),我們可以看到,空間是 O(n) 在棧上的,但是用 DP 我們可以把空間優(yōu)化到 O(1),DP 可以做到時(shí)間空間的雙重優(yōu)化。
其實(shí)呢,斐波那契數(shù)列在現(xiàn)實(shí)生活中也有很多應(yīng)用。
比如在我司以及很多大公司里,每個(gè)任務(wù)要給分值,1分表示大概需要花1天時(shí)間完成,然后分值只有1,2,3,5,8這5種,(如果有大于8分的任務(wù),就需要把它 break down 成8分以內(nèi)的,以便大家在兩周內(nèi)能完成。)
因?yàn)槿蝿?wù)是永遠(yuǎn)做不完的而每個(gè)人的時(shí)間是有限的,所以每次小組會(huì)開會(huì),挑出最重要的任務(wù)讓大家來做,然后每個(gè)人根據(jù)自己的 available 的天數(shù)去 pick up 相應(yīng)的任務(wù)。
披著羊皮的狼
那有同學(xué)可能會(huì)想,這題這么簡(jiǎn)單,這都 2020 年了,面試還會(huì)考么?
答:真的會(huì)。
只是不能以這么直白的方式給你了。
比如很有名的爬樓梯問題:
一個(gè) N 階的樓梯,每次能走一層或者兩層,問一共有多少種走法。
這個(gè)題這么想:
站在當(dāng)前位置,只能是從前一層,或者前兩層上來的,所以 f(n) = f(n-1) + f(n-2).
這題是我當(dāng)年面試時(shí)真實(shí)被問的,那時(shí)我還在寫 python,為了炫技,還用了lambda function:
f?=?lambda?n:?1?if?n?in?(1,?2)?else?f(n-1)?+?f(n-2)遞歸的寫法時(shí)間復(fù)雜度太高,所以又寫了一個(gè) for loop 的版本
def?fib(n)a,?b?=?1,?1for?i?in?range(n-1):a,?b?=?b,?a+breturn?a?然后還寫了個(gè) caching 的方法:
def?cache(f):memo?=?{}def?helper(x):if?x?not?in?memo:memo[x]?=?f(x)return?memo[x]return?helper @cache def?fibR(n):if?n==1?or?n==2:?return?1return?fibR(n-1)?+?fibR(n-2)還順便和面試官聊了下 tail recursion:
tail recursion 尾遞歸:就是遞歸的這句話是整個(gè)方法的最后一句話。
那這個(gè)有什么特別之處呢?
尾遞歸的特點(diǎn)就是我們可以很容易的把它轉(zhuǎn)成 iterative 的寫法,當(dāng)然有些智能的編譯器會(huì)自動(dòng)幫我們做了(不是說顯性的轉(zhuǎn)化,而是在運(yùn)行時(shí)按照 iterative 的方式去運(yùn)行,實(shí)際消耗的空間是 O(1))
那為什么呢?
因?yàn)榛貋淼臅r(shí)候不需要 backtrack,遞歸這里就是最后一步了,不需要再往上一層返值。
def?fib(n,?a=0,?b=1):if?n==0:?return?aif?n==1:?return?breturn?fib(n-1,?b,?a+b)最終,拿出了我的殺手锏:lambda and reduce
fibRe?=?lambda?n:?reduce(lambda?x,?n:?[x[1],?x[0]+x[1]],?range(n),?[0,?1])看到面試官滿意的表情后,就開始繼續(xù)深入的聊了...
所以說,不要以為它簡(jiǎn)單,同一道題可以用七八種方法來解,分析好每個(gè)方法的優(yōu)缺點(diǎn),引申到你可以引申的地方,展示自己扎實(shí)的基本功,這場(chǎng)面試其實(shí)就是你 show off 的機(jī)會(huì)~lol
如果大家喜歡這種形式,請(qǐng)素質(zhì)三連:
點(diǎn)擊在看,鼓勵(lì)下我!
瞎寫點(diǎn)評(píng)論,假裝我很紅!
轉(zhuǎn)發(fā)給「需要」的人,即使他不需要!
if快還是switch快?解密switch背后的秘密
一道題決定去留:為什么synchronized無法禁止指令重排,卻能保證有序性?
關(guān)注公眾號(hào)發(fā)送”進(jìn)群“,老王拉你進(jìn)讀者群。
總結(jié)
以上是生活随笔為你收集整理的「递归」的正确打开方式,看不懂你打我~的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一文学搞懂阿里开源的微服务新贵Nacos
- 下一篇: #39;boost/iterator/i