传统存储方式_分布式存储 vs 传统SAN、NAS 的优缺点分析
傳統(tǒng)存儲架構的局限性和分布式存儲的優(yōu)點
傳統(tǒng)SAN存儲設備一般采用雙控制器架構,兩者互為備份,配置兩臺交換機與前端的服務器進行連接,這種雙控制器架構方式會有以下兩個方面的缺點:
1. 網絡帶寬容易變成整個存儲性能的瓶頸;
2. 如果一個控制器損壞,系統(tǒng)的性能將大幅下降,影響存儲的正常使用。
傳統(tǒng)存儲架構的局限性主要體現在以下幾個方面:
1、橫向擴展性較差
受限于前端控制器的對外服務能力,縱向擴展磁盤數量無法有效提升存儲設備對外提供服務的能力。同時,前端控制器橫向擴展能力非常有限,業(yè)界最多僅能實現幾個控制器的橫向。因此,前端控制器成為整個存儲性能的瓶頸。
2、不同廠家傳統(tǒng)存儲之間的差異性帶來的管理問題
不同廠商設備的管理和使用方式各有不同,由于軟硬件緊耦合、管理接口不統(tǒng)一等限制因素無法做到資源的統(tǒng)一管理和彈性調度,也會帶來存儲利用率較低的現象。因此,不同存儲的存在影響了存儲使用的便利性和利用率。
分布式存儲往往采用分布式的系統(tǒng)結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息。它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展,將通用硬件引入的不穩(wěn)定因素降到最低。優(yōu)點如下:
1.高性能
一個具有高性能的分布式存戶通常能夠高效地管理讀緩存和寫緩存,并且支持自動的分級存儲。分布式存儲通過將熱點區(qū)域內數據映射到高速存儲中,來提高系統(tǒng)響應速度;一旦這些區(qū)域不再是熱點,那么存儲系統(tǒng)會將它們移出高速存儲。而寫緩存技術則可使配合高速存儲來明顯改變整體存儲的性能,按照一定的策略,先將數據寫入高速存儲,再在適當的時間進行同步落盤。
2.彈性擴展
得益于合理的分布式架構,分布式存儲可預估并且彈性擴展計算、存儲容量和性能。分布式存儲的水平擴展有以下幾個特性:
1) 節(jié)點擴展后,舊數據會自動遷移到新節(jié)點,實現負載均衡,避免單點過熱的情況出現;
2) 水平擴展只需要將新節(jié)點和原有集群連接到同一網絡,整個過程不會對業(yè)務造成影響;
3) 當節(jié)點被添加到集群,集群系統(tǒng)的整體容量和性能也隨之線性擴展,此后新節(jié)點的資源就會被管理平臺接管,被用于分配或者回收。
3.支持分級存儲
由于通過網絡進行松耦合鏈接,分布式存儲允許高速存儲和低速存儲分開部署,或者任意比例混布。在不可預測的業(yè)務環(huán)境或者敏捷應用情況下,分層存儲的優(yōu)勢可以發(fā)揮到最佳。解決了目前緩存分層存儲最大的問題是當性能池讀不命中后,從冷池提取數據的粒度太大,導致延遲高,從而給造成整體的性能的抖動的問題。
4.多副本的一致性
與傳統(tǒng)的存儲架構使用RAID模式來保證數據的可靠性不同,分布式存儲采用了多副本備份機制。在存儲數據之前,分布式存儲對數據進行了分片,分片后的數據按照一定的規(guī)則保存在集群節(jié)點上。為了保證多個數據副本之間的一致性,分布式存儲通常采用的是一個副本寫入,多個副本讀取的強一致性技術,使用鏡像、條帶、分布式校驗等方式滿足租戶對于可靠性不同的需求。在讀取數據失敗的時候,系統(tǒng)可以通過從其他副本讀取數據,重新寫入該副本進行恢復,從而保證副本的總數固定;當數據長時間處于不一致狀態(tài)時,系統(tǒng)會自動數據重建恢復,同時租戶可設定數據恢復的帶寬規(guī)則,最小化對業(yè)務的影響。
5.容災與備份
在分布式存儲的容災中,一個重要的手段就是多時間點快照技術,使得用戶生產系統(tǒng)能夠實現一定時間間隔下的各版本數據的保存。特別值得一提的是,多時間點快照技術支持同時提取多個時間點樣本同時恢復,這對于很多邏輯錯誤的災難定位十分有用,如果用戶有多臺服務器或虛擬機可以用作系統(tǒng)恢復,通過比照和分析,可以快速找到哪個時間點才是需要回復的時間點,降低了故障定位的難度,縮短了定位時間。這個功能還非常有利于進行故障重現,從而進行分析和研究,避免災難在未來再次發(fā)生。多副本技術,數據條帶化放置,多時間點快照和周期增量復制等技術為分布式存儲的高可靠性提供了保障。
6.存儲系統(tǒng)標準化
隨著分布式存儲的發(fā)展,存儲行業(yè)的標準化進程也不斷推進,分布式存儲優(yōu)先采用行業(yè)標準接口進行存儲接入。在平臺層面,通過將異構存儲資源進行抽象化,將傳統(tǒng)的存儲設備級的操作封裝成面向存儲資源的操作,從而簡化異構存儲基礎架構的操作,以實現存儲資源的集中管理,并能夠自動執(zhí)行創(chuàng)建、變更、回收等整個存儲生命周期流程。基于異構存儲整合的功能,用戶可以實現跨不同品牌、介質地實現容災,如用中低端陣列為高端陣列容災,用不同磁盤陣列為閃存陣列容災等等,從側面降低了存儲采購和管理成本。(觀點來自@baimmi ?某金融集團 架構師)
分布式存儲與傳統(tǒng)的SAN、NAS相比的優(yōu)勢和缺點
分布式存儲與傳統(tǒng)的SAN、NAS相比,優(yōu)勢如下:
1、性能:在分布式存儲達到一定規(guī)模是,性能會超過傳統(tǒng)的SAN、NAS。大量磁盤和節(jié)點,結合適當的數據分布策略,可以達到非常高的聚合帶寬。傳統(tǒng)的SAN、NAS都會有性能瓶頸,一旦達到最大擴展能力,性能不會改變甚至降低。
2、價格:傳統(tǒng)的SAN、NAS,價格比較高。特別是SAN網絡設備,光纖網絡成本比較高。而且,以后擴展還需要增加擴展柜。成本太高。分布式存儲只需要IP網絡,幾臺X86服務器加內置硬盤就可以組建起來,初期成本比較低。擴展也非常方便,加服務器就行。
3、可持續(xù)性:傳統(tǒng)的SAN、NAS擴展能力受限,一個機頭最多可以帶幾百個磁盤。如果想要個PB以上的共享存儲,分布式存儲只最好的選擇。不用擔心擴展能力問題。
缺點:
1、需要比較強的技術能力和運維能力,甚至有開發(fā)能力的用戶。傳統(tǒng)存儲開箱即用,硬件由廠家提供,也有完善的文檔和服務。而分布式很多是開源或者是有公司基于開源系統(tǒng)提供支持服務,版本迭代比較快,出問題后有可能需要自己解決。
2、數據一致性問題。對于Oracle RAC這一類對數據一致性要求比較高的應用場景,分布式存儲的性能可能就稍弱了,因為分布式的結構,數據同步是一個大問題,雖然現在技術一直在進步,但是也不如傳統(tǒng)存儲設備數據存儲方式可靠。
3、穩(wěn)定性問題。分布式存儲非常依賴網絡環(huán)境和帶寬,如果網絡發(fā)生抖動或者故障,都可能會影響分布式存儲系統(tǒng)運行。例如,一旦發(fā)生IP沖突,那么整體分布式存儲可能都無法訪問。傳統(tǒng)存儲一般使用專用SAN或IP網絡,穩(wěn)定性方面,更可靠一些。(觀點來自@劉東 某軟件集團?咨詢顧問)
關聯(lián)閱讀:
分布式存儲如何保證數據一致性?
從服務端角度,如何盡快將更新后的數據分布到整個系統(tǒng),降低達到最終一致性的時間窗口,是提高系統(tǒng)的可用度和用戶體驗非常重要的方面。對于分布式存儲系統(tǒng):
N — 數據復制的份數
W — 更新數據是需要保證寫完成的節(jié)點數
R — 讀取數據的時候需要讀取的節(jié)點數
如果W+R>N,寫的節(jié)點和讀的節(jié)點重疊,則是強一致性。例如對于典型的一主一備同步復制的分布式存儲系統(tǒng),N=2,W=2,R=1,則不管讀的是主副本還是從副本的數據,都是一致的。
如果W+R<=N,則是弱一致性。例如對于一主一備異步復制的分布式存儲,N=2,W=1,R=1,則如果讀的是從副本,就可能無法讀取主副本已經更新過的數據,從而讀到了臟數據所以是弱一致性。
對于分布存儲式系統(tǒng),為了保證高可用性,一般設置N>=3,且強制在主副本讀取,也是通常說的分布式存儲系統(tǒng)使用強一致性原則。(@baimmi?)
分布式存儲的文件存儲和對象存儲有哪些區(qū)別?
文件存儲與對象存儲區(qū)別主要可從三方面來進行比較:
1、展現模式:?
文件存儲:以盤符 / 目錄的形式展現,優(yōu)點是符合用戶現有使用習慣,用戶可以像使用本地硬盤一樣使用存儲系統(tǒng),缺點是無法定制化存儲元數據信息,對業(yè)務系統(tǒng)無優(yōu)化;
對象存儲:與應用系統(tǒng)相結合形式展現,優(yōu)點是可按需調用存儲接口,并為文件設置元數據以及標簽屬性,可滿足業(yè)務系統(tǒng)定制化需求,缺點是需要業(yè)務系統(tǒng)直接調用存儲,用戶無法直接調用系統(tǒng)內數據。
2、訪問協(xié)議
文件存儲:NFS/CIFS 協(xié)議訪問,優(yōu)點是鎖機制可支持多人同時對數據進行修改(鎖機制由應用系統(tǒng)決定 , 缺點是為保證數據訪問一致性,需要進行數據索引信息同步,對系統(tǒng)并發(fā)性能以及系統(tǒng)規(guī)模存在較大影響。?
對象存儲:HTTP 傳輸協(xié)議以及 RESTful 接口訪問,優(yōu)點是通過算法存放文件元數據信息,無元數據同步限制,系統(tǒng)可無限制擴展,且性能隨著存儲系統(tǒng)規(guī)模擴展而線性提升,缺點是采用 RESTful 接口 Put 、 Get 、 Delete ,不支持多人同時對同一文件修改。
3、數據結構
文件存儲:采用樹形目錄結構,讀取和存儲數據要經過更長路徑才能到達目標位置。隨著數據越來越多,目錄結構會越來越繁雜,查找以及調取文件的速度會越來越慢(操作系統(tǒng)對目錄字節(jié)數存在限制);?如若出現設備損壞或者擴容時,需要將巨型目錄樹中的數據重新分配均衡,效率較差。
對象存儲:采用扁平目錄結構,拋棄了嵌套的文件夾,避免維護龐大的目錄樹,只保留二級(或三級)目錄結構。根下直接就是桶 桶中直接存放對象,桶中不能再建桶(禁止多層文件夾)。?每個對象文件都只需要一個 ID 就能獲取對象。
適用場景總結:
文件存儲:數百 TB-PB 級數據并行計算類應用;億級別以內小文件存儲類應用;需要在線修改數據類應用系統(tǒng),如:非編系統(tǒng)。
對象存儲:PB- 數百 PB 級數據存儲存儲類應用;千億級海量小文件數據存儲以及海量并發(fā)。(@趙琳)
?相關推薦:
五大主流分布式存儲技術對比分析,你 pick 哪一種?
分布式存儲技術路線選型探討:HDFS、Ceph、GFS、gpfs、Switf等各種技術的特點和適用場景?
http://www.talkwithtrend.com/Question/424127
歡迎關注社區(qū)“分布式存儲”技術主題?,將會不斷更新優(yōu)質資料、文章。地址:
http://www.talkwithtrend.com/Topic/23951
下載 twt 社區(qū)客戶端 APP
與更多同行在一起
高手隨時解答你的疑難問題
輕松訂閱各領域技術主題
瀏覽下載最新文章資料
長按識別二維碼即可下載
或到應用商店搜索“twt”
長按二維碼關注公眾號*本公眾號所發(fā)布內容僅代表作者觀點,不代表社區(qū)立場
總結
以上是生活随笔為你收集整理的传统存储方式_分布式存储 vs 传统SAN、NAS 的优缺点分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ajax 成功回调函数,jQuery的阿
- 下一篇: qq空间网页版电脑_常用QQ软件,电脑C