分布式系统中的CAP理论和BASE理论详解
一.CAP理論
CAP 理論/定理open in new window起源于 2000年,由加州大學(xué)伯克利分校的Eric Brewer教授在分布式計(jì)算原理研討會(huì)(PODC)上提出,因此 CAP定理又被稱作?布魯爾定理(Brewer’s theorem)
2年后,麻省理工學(xué)院的Seth Gilbert和Nancy Lynch 發(fā)表了布魯爾猜想的證明,CAP理論正式成為分布式領(lǐng)域的定理。
簡(jiǎn)介
CAP?也就是?Consistency(一致性)、Availability(可用性)、Partition Tolerance(分區(qū)容錯(cuò)性)?這三個(gè)單詞首字母組合。
CAP 理論的提出者布魯爾在提出 CAP 猜想的時(shí)候,并沒(méi)有詳細(xì)定義?Consistency、Availability、Partition Tolerance?三個(gè)單詞的明確定義。
因此,對(duì)于 CAP 的民間解讀有很多,一般比較被大家推薦的是下面 👇 這種版本的解讀。
在理論計(jì)算機(jī)科學(xué)中,CAP 定理(CAP theorem)指出對(duì)于一個(gè)分布式系統(tǒng)來(lái)說(shuō),當(dāng)設(shè)計(jì)讀寫(xiě)操作時(shí),只能同時(shí)滿足以下三點(diǎn)中的兩個(gè):
- 一致性(Consistency)?: 所有節(jié)點(diǎn)訪問(wèn)同一份最新的數(shù)據(jù)副本
- 可用性(Availability): 非故障的節(jié)點(diǎn)在合理的時(shí)間內(nèi)返回合理的響應(yīng)(不是錯(cuò)誤或者超時(shí)的響應(yīng))。
- 分區(qū)容錯(cuò)性(Partition tolerance)?: 分布式系統(tǒng)出現(xiàn)網(wǎng)絡(luò)分區(qū)的時(shí)候,仍然能夠?qū)ν馓峁┓?wù)。
什么是網(wǎng)絡(luò)分區(qū)?
分布式系統(tǒng)中,多個(gè)節(jié)點(diǎn)之前的網(wǎng)絡(luò)本來(lái)是連通的,但是因?yàn)槟承┕收?#xff08;比如部分節(jié)點(diǎn)網(wǎng)絡(luò)出了問(wèn)題)某些節(jié)點(diǎn)之間不連通了,整個(gè)網(wǎng)絡(luò)就分成了幾塊區(qū)域,這就叫網(wǎng)絡(luò)分區(qū)。
不是所謂的“3 選 2”
大部分人解釋這一定律時(shí),常常簡(jiǎn)單的表述為:“一致性、可用性、分區(qū)容忍性三者你只能同時(shí)達(dá)到其中兩個(gè),不可能同時(shí)達(dá)到”。實(shí)際上這是一個(gè)非常具有誤導(dǎo)性質(zhì)的說(shuō)法,而且在 CAP 理論誕生 12 年之后,CAP 之父也在 2012 年重寫(xiě)了之前的論文。
當(dāng)發(fā)生網(wǎng)絡(luò)分區(qū)的時(shí)候,如果我們要繼續(xù)服務(wù),那么強(qiáng)一致性和可用性只能 2 選 1。也就是說(shuō)當(dāng)網(wǎng)絡(luò)分區(qū)之后 P 是前提,決定了 P 之后才有 C 和 A 的選擇。也就是說(shuō)分區(qū)容錯(cuò)性(Partition tolerance)我們是必須要實(shí)現(xiàn)的。
簡(jiǎn)而言之就是:CAP 理論中分區(qū)容錯(cuò)性 P 是一定要滿足的,在此基礎(chǔ)上,只能滿足可用性 A 或者一致性 C。
因此,分布式系統(tǒng)理論上不可能選擇 CA 架構(gòu),只能選擇 CP 或者 AP 架構(gòu)。?比如 ZooKeeper、HBase 就是 CP 架構(gòu),Cassandra、Eureka 就是 AP 架構(gòu),Nacos 不僅支持 CP 架構(gòu)也支持 AP 架構(gòu)。
為啥不可能選擇 CA 架構(gòu)呢??舉個(gè)例子:若系統(tǒng)出現(xiàn)“分區(qū)”,系統(tǒng)中的某個(gè)節(jié)點(diǎn)在進(jìn)行寫(xiě)操作。為了保證 C, 必須要禁止其他節(jié)點(diǎn)的讀寫(xiě)操作,這就和 A 發(fā)生沖突了。如果為了保證 A,其他節(jié)點(diǎn)的讀寫(xiě)操作正常的話,那就和 C 發(fā)生沖突了。
選擇 CP 還是 AP 的關(guān)鍵在于當(dāng)前的業(yè)務(wù)場(chǎng)景,沒(méi)有定論,比如對(duì)于需要確保強(qiáng)一致性的場(chǎng)景如銀行一般會(huì)選擇保證 CP 。
另外,需要補(bǔ)充說(shuō)明的一點(diǎn)是:?如果網(wǎng)絡(luò)分區(qū)正常的話(系統(tǒng)在絕大部分時(shí)候所處的狀態(tài)),也就說(shuō)不需要保證 P 的時(shí)候,C 和 A 能夠同時(shí)保證。
CAP 實(shí)際應(yīng)用案例
我這里以注冊(cè)中心來(lái)探討一下 CAP 的實(shí)際應(yīng)用。考慮到很多小伙伴不知道注冊(cè)中心是干嘛的,這里簡(jiǎn)單以 Dubbo 為例說(shuō)一說(shuō)。
下圖是 Dubbo 的架構(gòu)圖。注冊(cè)中心 Registry 在其中扮演了什么角色呢?提供了什么服務(wù)呢?
注冊(cè)中心負(fù)責(zé)服務(wù)地址的注冊(cè)與查找,相當(dāng)于目錄服務(wù),服務(wù)提供者和消費(fèi)者只在啟動(dòng)時(shí)與注冊(cè)中心交互,注冊(cè)中心不轉(zhuǎn)發(fā)請(qǐng)求,壓力較小。
常見(jiàn)的可以作為注冊(cè)中心的組件有:ZooKeeper、Eureka、Nacos...。
總結(jié)
在進(jìn)行分布式系統(tǒng)設(shè)計(jì)和開(kāi)發(fā)時(shí),我們不應(yīng)該僅僅局限在 CAP 問(wèn)題上,還要關(guān)注系統(tǒng)的擴(kuò)展性、可用性等等
在系統(tǒng)發(fā)生“分區(qū)”的情況下,CAP 理論只能滿足 CP 或者 AP。要注意的是,這里的前提是系統(tǒng)發(fā)生了“分區(qū)”
如果系統(tǒng)沒(méi)有發(fā)生“分區(qū)”的話,節(jié)點(diǎn)間的網(wǎng)絡(luò)連接通信正常的話,也就不存在 P 了。這個(gè)時(shí)候,我們就可以同時(shí)保證 C 和 A 了。
總結(jié):如果系統(tǒng)發(fā)生“分區(qū)”,我們要考慮選擇 CP 還是 AP。如果系統(tǒng)沒(méi)有發(fā)生“分區(qū)”的話,我們要思考如何保證 CA 。
相關(guān)閱讀:
神一樣的CAP理論被應(yīng)用在何方 - 掘金
二.BASE 理論
BASE 理論open in new window起源于 2008 年, 由eBay的架構(gòu)師Dan Pritchett在ACM上發(fā)表。
簡(jiǎn)介
BASE?是?Basically Available(基本可用)?、Soft-state(軟狀態(tài))?和?Eventually Consistent(最終一致性)?三個(gè)短語(yǔ)的縮寫(xiě)。BASE 理論是對(duì) CAP 中一致性 C 和可用性 A 權(quán)衡的結(jié)果,其來(lái)源于對(duì)大規(guī)模互聯(lián)網(wǎng)系統(tǒng)分布式實(shí)踐的總結(jié),是基于 CAP 定理逐步演化而來(lái)的,它大大降低了我們對(duì)系統(tǒng)的要求。
BASE 理論的核心思想
即使無(wú)法做到強(qiáng)一致性,但每個(gè)應(yīng)用都可以根據(jù)自身業(yè)務(wù)特點(diǎn),采用適當(dāng)?shù)姆绞絹?lái)使系統(tǒng)達(dá)到最終一致性。
也就是犧牲數(shù)據(jù)的一致性來(lái)滿足系統(tǒng)的高可用性,系統(tǒng)中一部分?jǐn)?shù)據(jù)不可用或者不一致時(shí),仍需要保持系統(tǒng)整體“主要可用”。
BASE 理論本質(zhì)上是對(duì) CAP 的延伸和補(bǔ)充,更具體地說(shuō),是對(duì) CAP 中 AP 方案的一個(gè)補(bǔ)充。
為什么這樣說(shuō)呢?
CAP 理論這節(jié)我們也說(shuō)過(guò)了:
如果系統(tǒng)沒(méi)有發(fā)生“分區(qū)”的話,節(jié)點(diǎn)間的網(wǎng)絡(luò)連接通信正常的話,也就不存在 P 了。這個(gè)時(shí)候,我們就可以同時(shí)保證 C 和 A 了。因此,如果系統(tǒng)發(fā)生“分區(qū)”,我們要考慮選擇 CP 還是 AP。如果系統(tǒng)沒(méi)有發(fā)生“分區(qū)”的話,我們要思考如何保證 CA 。
因此,AP 方案只是在系統(tǒng)發(fā)生分區(qū)的時(shí)候放棄一致性,而不是永遠(yuǎn)放棄一致性。在分區(qū)故障恢復(fù)后,系統(tǒng)應(yīng)該達(dá)到最終一致性。這一點(diǎn)其實(shí)就是 BASE 理論延伸的地方。
BASE 理論三要素
1. 基本可用
基本可用是指分布式系統(tǒng)在出現(xiàn)不可預(yù)知故障的時(shí)候,允許損失部分可用性。但是,這絕不等價(jià)于系統(tǒng)不可用。
什么叫允許損失部分可用性呢?
- 響應(yīng)時(shí)間上的損失: 正常情況下,處理用戶請(qǐng)求需要 0.5s 返回結(jié)果,但是由于系統(tǒng)出現(xiàn)故障,處理用戶請(qǐng)求的時(shí)間變?yōu)?3 s。
- 系統(tǒng)功能上的損失:正常情況下,用戶可以使用系統(tǒng)的全部功能,但是由于系統(tǒng)訪問(wèn)量突然劇增,系統(tǒng)的部分非核心功能無(wú)法使用。
2. 軟狀態(tài)
軟狀態(tài)指允許系統(tǒng)中的數(shù)據(jù)存在中間狀態(tài)(CAP 理論中的數(shù)據(jù)不一致),并認(rèn)為該中間狀態(tài)的存在不會(huì)影響系統(tǒng)的整體可用性,即允許系統(tǒng)在不同節(jié)點(diǎn)的數(shù)據(jù)副本之間進(jìn)行數(shù)據(jù)同步的過(guò)程存在延時(shí)。
3. 最終一致性
最終一致性強(qiáng)調(diào)的是系統(tǒng)中所有的數(shù)據(jù)副本,在經(jīng)過(guò)一段時(shí)間的同步后,最終能夠達(dá)到一個(gè)一致的狀態(tài)。因此,最終一致性的本質(zhì)是需要系統(tǒng)保證最終數(shù)據(jù)能夠達(dá)到一致,而不需要實(shí)時(shí)保證系統(tǒng)數(shù)據(jù)的強(qiáng)一致性。
分布式一致性的 3 種級(jí)別:
強(qiáng)一致性?:系統(tǒng)寫(xiě)入了什么,讀出來(lái)的就是什么。
弱一致性?:不一定可以讀取到最新寫(xiě)入的值,也不保證多少時(shí)間之后讀取到的數(shù)據(jù)是最新的,只是會(huì)盡量保證某個(gè)時(shí)刻達(dá)到數(shù)據(jù)一致的狀態(tài)。
最終一致性?:弱一致性的升級(jí)版,系統(tǒng)會(huì)保證在一定時(shí)間內(nèi)達(dá)到數(shù)據(jù)一致的狀態(tài)。
業(yè)界比較推崇是最終一致性級(jí)別,但是某些對(duì)數(shù)據(jù)一致要求十分嚴(yán)格的場(chǎng)景比如銀行轉(zhuǎn)賬還是要保證強(qiáng)一致性。
那實(shí)現(xiàn)最終一致性的具體方式是什么呢??《分布式協(xié)議與算法實(shí)戰(zhàn)》open in new window?中是這樣介紹:
- 讀時(shí)修復(fù)?: 在讀取數(shù)據(jù)時(shí),檢測(cè)數(shù)據(jù)的不一致,進(jìn)行修復(fù)。比如 Cassandra 的 Read Repair 實(shí)現(xiàn),具體來(lái)說(shuō),在向 Cassandra 系統(tǒng)查詢數(shù)據(jù)的時(shí)候,如果檢測(cè)到不同節(jié)點(diǎn) 的副本數(shù)據(jù)不一致,系統(tǒng)就自動(dòng)修復(fù)數(shù)據(jù)。
- 寫(xiě)時(shí)修復(fù)?: 在寫(xiě)入數(shù)據(jù),檢測(cè)數(shù)據(jù)的不一致時(shí),進(jìn)行修復(fù)。比如 Cassandra 的 Hinted Handoff 實(shí)現(xiàn)。具體來(lái)說(shuō),Cassandra 集群的節(jié)點(diǎn)之間遠(yuǎn)程寫(xiě)數(shù)據(jù)的時(shí)候,如果寫(xiě)失敗 就將數(shù)據(jù)緩存下來(lái),然后定時(shí)重傳,修復(fù)數(shù)據(jù)的不一致性。
- 異步修復(fù)?: 這個(gè)是最常用的方式,通過(guò)定時(shí)對(duì)賬檢測(cè)副本數(shù)據(jù)的一致性,并修復(fù)。
比較推薦?寫(xiě)時(shí)修復(fù),這種方式對(duì)性能消耗比較低。
參考文章:https://javaguide.cn/distributed-system/theorem&algorithm&protocol/cap&base-theorem.html#cap%E7%90%86%E8%AE%BA
總結(jié)
以上是生活随笔為你收集整理的分布式系统中的CAP理论和BASE理论详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
 
                            
                        - 上一篇: alter session set ev
- 下一篇: Paxos算法和Raft算法---经典的
