面试必备:缓存穿透,缓存雪崩的四种解决方案
前言
設(shè)計(jì)一個(gè)緩存系統(tǒng),不得不考慮的問(wèn)題就是:緩存穿透、緩存擊穿與失效時(shí)的雪崩效應(yīng)。
?
緩存穿透
緩存穿透是指查詢(xún)一個(gè)一定不存在的數(shù)據(jù),由于緩存是不命中時(shí)被動(dòng)寫(xiě)的,并且出于容錯(cuò)考慮,如果從存儲(chǔ)層查不到數(shù)據(jù)則不寫(xiě)入緩存,這將導(dǎo)致這個(gè)不存在的數(shù)據(jù)每次請(qǐng)求都要到存儲(chǔ)層去查詢(xún),失去了緩存的意義。在流量大時(shí),可能DB就掛掉了,要是有人利用不存在的key頻繁攻擊我們的應(yīng)用,這就是漏洞。
解決方案
有很多種方法可以有效地解決緩存穿透問(wèn)題,最常見(jiàn)的是采用布隆過(guò)濾器,將所有可能存在的數(shù)據(jù)哈希到一個(gè)足夠大的bitmap中,一個(gè)一定不存在的數(shù)據(jù)會(huì)被這個(gè)bitmap攔截掉,從而避免了對(duì)底層存儲(chǔ)系統(tǒng)的查詢(xún)壓力。另外也有一個(gè)更為簡(jiǎn)單粗暴的方法(我們采用的就是這種),如果一個(gè)查詢(xún)返回的數(shù)據(jù)為空(不管是數(shù)據(jù)不存在,還是系統(tǒng)故障),我們?nèi)匀话堰@個(gè)空結(jié)果進(jìn)行緩存,但它的過(guò)期時(shí)間會(huì)很短,最長(zhǎng)不超過(guò)五分鐘。
?
緩存雪崩
緩存雪崩是指在我們?cè)O(shè)置緩存時(shí)采用了相同的過(guò)期時(shí)間,導(dǎo)致緩存在某一時(shí)刻同時(shí)失效,請(qǐng)求全部轉(zhuǎn)發(fā)到DB,DB瞬時(shí)壓力過(guò)重導(dǎo)致雪崩。
解決方案
緩存失效時(shí)的雪崩效應(yīng)對(duì)底層系統(tǒng)的沖擊非常可怕。大多數(shù)系統(tǒng)設(shè)計(jì)者考慮用加鎖或者隊(duì)列的方式保證緩存的單線(xiàn)程(進(jìn)程)寫(xiě),從而避免失效時(shí)大量的并發(fā)請(qǐng)求落到底層存儲(chǔ)系統(tǒng)上。這里分享一個(gè)簡(jiǎn)單方案,就是將緩存失效時(shí)間分散開(kāi),比如我們可以在原有的失效時(shí)間基礎(chǔ)上增加一個(gè)隨機(jī)值,比如1-5分鐘隨機(jī),這樣每一個(gè)緩存的過(guò)期時(shí)間的重復(fù)率就會(huì)降低,就很難引發(fā)集體失效的事件。
?
緩存擊穿
對(duì)于一些設(shè)置了過(guò)期時(shí)間的key,如果這些key可能會(huì)在某些時(shí)間點(diǎn)被超高并發(fā)地訪(fǎng)問(wèn),是一種非常“熱點(diǎn)”的數(shù)據(jù)。這個(gè)時(shí)候,需要考慮一個(gè)問(wèn)題:緩存被“擊穿”的問(wèn)題,這個(gè)和緩存雪崩的區(qū)別在于這里針對(duì)某一key緩存,前者則是很多key。
緩存在某個(gè)時(shí)間點(diǎn)過(guò)期的時(shí)候,恰好在這個(gè)時(shí)間點(diǎn)對(duì)這個(gè)Key有大量的并發(fā)請(qǐng)求過(guò)來(lái),這些請(qǐng)求發(fā)現(xiàn)緩存過(guò)期一般都會(huì)從后端DB加載數(shù)據(jù)并回設(shè)到緩存,這個(gè)時(shí)候大并發(fā)的請(qǐng)求可能會(huì)瞬間把后端DB壓垮。
解決方案
我們的目標(biāo)是:盡量少的線(xiàn)程構(gòu)建緩存(甚至是一個(gè)) + 數(shù)據(jù)一致性 + 較少的潛在危險(xiǎn),下面會(huì)介紹四種方法來(lái)解決這個(gè)問(wèn)題:
1、使用互斥鎖(mutex key):
這種解決方案思路比較簡(jiǎn)單,就是只讓一個(gè)線(xiàn)程構(gòu)建緩存,其他線(xiàn)程等待構(gòu)建緩存的線(xiàn)程執(zhí)行完,重新從緩存獲取數(shù)據(jù)就可以了(如下圖)
如果是單機(jī),可以用synchronized或者lock來(lái)處理,如果是分布式環(huán)境可以用分布式鎖就可以了(分布式鎖,可以用memcache的add, redis的setnx, zookeeper的添加節(jié)點(diǎn)操作)。
下面是Tim yang博客的代碼,是memcache的偽代碼實(shí)現(xiàn)
if (memcache.get(key) == null) { ?// 3 min timeout to avoid mutex holder crash ?if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { ?value = db.get(key); ?memcache.set(key, value); ?memcache.delete(key_mutex); ?} else { ?sleep(50); ?retry(); ?} ?}如果換成redis,就是:
String get(String key) { ?String value = redis.get(key); ?if (value ?== null) { ?if (redis.setnx(key_mutex, "1")) { ?// 3 min timeout to avoid mutex holder crash ?redis.expire(key_mutex, 3 * 60) ?value = db.get(key); ?redis.set(key, value); ?redis.delete(key_mutex); ?} else { ?//其他線(xiàn)程休息50毫秒后重試 ?Thread.sleep(50); ?get(key); ?} ?} ?} ?2、"提前"使用互斥鎖(mutex key):
在value內(nèi)部設(shè)置1個(gè)超時(shí)值(timeout1), timeout1比實(shí)際的memcache timeout(timeout2)小。當(dāng)從cache讀取到timeout1發(fā)現(xiàn)它已經(jīng)過(guò)期時(shí)候,馬上延長(zhǎng)timeout1并重新設(shè)置到cache。然后再?gòu)臄?shù)據(jù)庫(kù)加載數(shù)據(jù)并設(shè)置到cache中。偽代碼如下:
v = memcache.get(key); ? if (v == null) { ?if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { ?value = db.get(key); ?memcache.set(key, value); ?memcache.delete(key_mutex); ?} else { ?sleep(50); ?retry(); ?} ? } else { ?if (v.timeout <= now()) { ?if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { ?// extend the timeout for other threads ?v.timeout += 3 * 60 * 1000; ?memcache.set(key, v, KEY_TIMEOUT * 2); ?// load the latest value from db ?v = db.get(key); ?v.timeout = KEY_TIMEOUT; ?memcache.set(key, value, KEY_TIMEOUT * 2); ?memcache.delete(key_mutex); ?} else { ?sleep(50); ?retry(); ?} ?} ?} ?3、"永遠(yuǎn)不過(guò)期":
這里的“永遠(yuǎn)不過(guò)期”包含兩層意思:
1、從redis上看,確實(shí)沒(méi)有設(shè)置過(guò)期時(shí)間,這就保證了,不會(huì)出現(xiàn)熱點(diǎn)key過(guò)期問(wèn)題,也就是“物理”不過(guò)期。
2、從功能上看,如果不過(guò)期,那不就成靜態(tài)的了嗎?所以我們把過(guò)期時(shí)間存在key對(duì)應(yīng)的value里,如果發(fā)現(xiàn)要過(guò)期了,通過(guò)一個(gè)后臺(tái)的異步線(xiàn)程進(jìn)行緩存的構(gòu)建,也就是“邏輯”過(guò)期
從實(shí)戰(zhàn)看,這種方法對(duì)于性能非常友好,唯一不足的就是構(gòu)建緩存時(shí)候,其余線(xiàn)程(非構(gòu)建緩存的線(xiàn)程)可能訪(fǎng)問(wèn)的是老數(shù)據(jù),但是對(duì)于一般的互聯(lián)網(wǎng)功能來(lái)說(shuō)這個(gè)還是可以忍受。
String get(final String key) { ?V v = redis.get(key); ?String value = v.getValue(); ?long timeout = v.getTimeout(); ?if (v.timeout <= System.currentTimeMillis()) { ?// 異步更新后臺(tái)異常執(zhí)行 ?threadPool.execute(new Runnable() { ?public void run() { ?String keyMutex = "mutex:" + key; ?if (redis.setnx(keyMutex, "1")) { ?// 3 min timeout to avoid mutex holder crash ?redis.expire(keyMutex, 3 * 60); ?String dbValue = db.get(key); ?redis.set(key, dbValue); ?redis.delete(keyMutex); ?} ?} ?}); ?} ?return value; ?} ?4、資源保護(hù):
之前在緩存雪崩那篇文章提到了netflix的hystrix,可以做資源的隔離保護(hù)主線(xiàn)程池,如果把這個(gè)應(yīng)用到緩存的構(gòu)建也未嘗不可。
三、四種方案對(duì)比:
作為一個(gè)并發(fā)量較大的互聯(lián)網(wǎng)應(yīng)用,我們的目標(biāo)有3個(gè): 1、加快用戶(hù)訪(fǎng)問(wèn)速度,提高用戶(hù)體驗(yàn)。 2、降低后端負(fù)載,保證系統(tǒng)平穩(wěn)。 3、保證數(shù)據(jù)“盡可能”及時(shí)更新(要不要完全一致,取決于業(yè)務(wù),而不是技術(shù)。)
所以第二節(jié)中提到的四種方法,可以做如下比較,還是那就話(huà):沒(méi)有最好,只有最合適。
解決方案
一、簡(jiǎn)單分布式鎖(Tim yang)
優(yōu)點(diǎn)
1、思路簡(jiǎn)單
2、保證一致性
缺點(diǎn)
1、代碼復(fù)雜度增大
2、存在死鎖的風(fēng)險(xiǎn)
3、存在線(xiàn)程池阻塞的風(fēng)險(xiǎn)
二、加另外一個(gè)過(guò)期時(shí)間(Tim yang)
優(yōu)點(diǎn)
1、保證一致性
缺點(diǎn)
1、代碼復(fù)雜度增大
2、存在死鎖的風(fēng)險(xiǎn)
3、存在線(xiàn)程池阻塞的風(fēng)險(xiǎn)
三、不過(guò)期(本文)
優(yōu)點(diǎn)
1、異步構(gòu)建緩存,不會(huì)阻塞線(xiàn)程池
缺點(diǎn)
1、不保證一致性。
2、代碼復(fù)雜度增大(每個(gè)value都要維護(hù)一個(gè)timekey)。
3、占用一定的內(nèi)存空間(每個(gè)value都要維護(hù)一個(gè)timekey)。
四、不過(guò)期(本文)
優(yōu)點(diǎn)
1、hystrix技術(shù)成熟,有效保證后端。
2、hystrix監(jiān)控強(qiáng)大。
缺點(diǎn)
1、部分訪(fǎng)問(wèn)存在降級(jí)策略。
?
總結(jié)
熱點(diǎn)key + 過(guò)期時(shí)間 + 復(fù)雜的構(gòu)建緩存過(guò)程 => mutex key問(wèn)題 構(gòu)建緩存一個(gè)線(xiàn)程做就可以了。 四種解決方案:沒(méi)有最佳只有最合適。
?
出處:https://dwz.cn/E17vTJXl
總結(jié)
以上是生活随笔為你收集整理的面试必备:缓存穿透,缓存雪崩的四种解决方案的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 看看这些被同事喷的 JS 代码风格你写过
- 下一篇: JAVA拾遗--关于SPI机制