对象存储界的“百变星君”来了,非结构化数据存储还是事儿吗?
關(guān)注我們牛年牛氣沖天
全世界80%的數(shù)據(jù)是非結(jié)構(gòu)化的!(潛臺詞:非結(jié)構(gòu)化數(shù)據(jù)非常重要)
非結(jié)構(gòu)化數(shù)據(jù)的增長非常迅速。IDC預(yù)測,截止2023年,全球文件和對象數(shù)據(jù)容量增長3倍。(潛臺詞:非結(jié)構(gòu)化數(shù)據(jù)的存儲將是個大難題,但同時非結(jié)構(gòu)化數(shù)據(jù)又是一座亟待挖掘的金礦)
其實,對于非結(jié)構(gòu)化數(shù)據(jù)我們已經(jīng)習(xí)以為常,文件、圖片、音視頻,以及來自社交媒體、IoT的海量數(shù)據(jù)都屬于非結(jié)構(gòu)化數(shù)據(jù)。但是就像“不識廬山真面目,只緣身在此山中”所描述的那樣,當(dāng)我們真的陷入非結(jié)構(gòu)化數(shù)據(jù)的海洋之中,你對非結(jié)構(gòu)化數(shù)據(jù)的了解真的成竹在胸嗎?你真的能夠洞察非結(jié)構(gòu)化數(shù)據(jù)中蘊藏的價值嗎?你對非結(jié)構(gòu)化數(shù)據(jù)的存儲真的那么有把握,能夠做到快速、高效和低成本嗎?
對于非結(jié)構(gòu)化數(shù)據(jù),以及非結(jié)構(gòu)化數(shù)據(jù)的存儲、應(yīng)用和進一步挖掘都還在路上!
你真的了解非結(jié)構(gòu)化數(shù)據(jù)嗎?
雖然非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量龐大,但給人的感覺是價值密度低,所以以前人們將更多的精力放在存儲和優(yōu)化與交易直接相關(guān)的塊數(shù)據(jù)上。但其實與規(guī)整的數(shù)據(jù)庫中的數(shù)據(jù)相比,五花八門的非結(jié)構(gòu)化數(shù)據(jù)的存儲、分析、挖掘和洞察其實更難,它就像是隱藏在海平面以下的巨大的冰山。
非結(jié)構(gòu)化數(shù)據(jù)無處不在,歸納起來,主要來自三個方面:一是企業(yè)IT部門管理的數(shù)據(jù),包括文件共享、主目錄、文件檔案庫,以及視頻監(jiān)控數(shù)據(jù)等;二是行業(yè)應(yīng)用數(shù)據(jù),比如視頻數(shù)據(jù)、生命科學(xué)中的基因測序分析,以及石油、能源、氣象、地震等領(lǐng)域用到的數(shù)據(jù)等;三是來自新興業(yè)務(wù)領(lǐng)域的數(shù)據(jù),包括云計算、大數(shù)據(jù)、人工智能、IoT、虛擬現(xiàn)實、區(qū)塊鏈等。
隨著“大數(shù)據(jù)”這一概念被提出并且得到越來越多人的認可,非結(jié)構(gòu)化數(shù)據(jù)的價值也得到了進一步彰顯。擁有大數(shù)據(jù)和具有大數(shù)據(jù)處理分析能力的公司,將在數(shù)字化時代占得先機成了行業(yè)共識。“非結(jié)構(gòu)化數(shù)據(jù)是一座金礦,但是如何從中挖掘出金子,卻存在諸多挑戰(zhàn)。”戴爾科技集團大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲事業(yè)部技術(shù)總監(jiān)胡淵汶指出,在非結(jié)構(gòu)化數(shù)據(jù)的存儲和使用上主要有以下兩大障礙。
戴爾科技集團大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲事業(yè)部技術(shù)總監(jiān) 胡淵汶
第一,快速增長的非結(jié)構(gòu)化數(shù)據(jù)量超乎人們的想象,而且越來越多的用戶傾向于不隨便刪除數(shù)據(jù),這就給數(shù)據(jù)的長期保留,以及數(shù)據(jù)價值的進一步挖掘提出了新的更高的要求。更突出的一個矛盾還在于,在存儲壓力逐步增加的同時,企業(yè)的IT預(yù)算并沒有隨之大幅增加,如何在嚴格控制成本的前提下,更好地處理非結(jié)構(gòu)化數(shù)據(jù)成了一個棘手的問題。
第二,應(yīng)用現(xiàn)代化帶來的挑戰(zhàn)。很多用戶的應(yīng)用開發(fā)和部署逐漸走向云原生。IDC預(yù)測,到2022年,90%新開發(fā)的應(yīng)用都將是云原生的,云原生將成為市場主流。這就意味著企業(yè)的存儲技術(shù)架構(gòu)必須與時俱進,滿足應(yīng)用現(xiàn)代化和云原生的要求。隨著越來越多的企業(yè)采用新的應(yīng)用架構(gòu)、微服務(wù)、容器等技術(shù),傳統(tǒng)的存儲解決方案和數(shù)據(jù)庫已無法滿足新應(yīng)用架構(gòu)對簡易性、靈活性等的要求。
二十年、三代,成熟穩(wěn)定的保證
在“大數(shù)據(jù)”的概念出現(xiàn)前,企業(yè)存儲數(shù)據(jù)通常采用簡單的“二分法”,即塊數(shù)據(jù)采用SAN,而文件數(shù)據(jù)采用NAS,清晰明了。但是隨著數(shù)據(jù)量和數(shù)據(jù)類型的增加,特別是各種新的應(yīng)用層出不窮,“二分法”這種粗放式的數(shù)據(jù)存儲模式顯然已經(jīng)不再適用。對象存儲應(yīng)運而生。
現(xiàn)在一談到對象存儲,很多人首先會想到大型互聯(lián)網(wǎng)企業(yè)和云服務(wù)商,因為它們是對象存儲的大力倡導(dǎo)者和忠實擁躉,對象存儲的部署非常普遍,而且應(yīng)用規(guī)模通常比較大。但你可能不太了解,在企業(yè)級對象存儲領(lǐng)域還有一個骨灰級的玩家——Dell EMC。
戴爾科技集團現(xiàn)在的對象存儲主打產(chǎn)品——Dell EMC Elastic Cloud Storage (ECS) 經(jīng)過了二十多年、三代產(chǎn)品的打磨和持續(xù)演進。
早在2000年,當(dāng)時的EMC公司收購了一家對象存儲領(lǐng)域的初創(chuàng)公司FilePool,在對其產(chǎn)品進行改造和增強后,于2001年推出首款劃時代的產(chǎn)品——CENTERA。CENTERA采用了自主的專用API\SDK和單一命名空間。CENTERA一經(jīng)推出便受到市場的熱捧。尤其是在“安然事件”曝出后,美國國會和政府加速通過了《薩班斯—奧克斯利法案》,而CENTERA是符合該法案的解決方案,因此贏得了大批上市公司的青睞。
2009年,在對CENTERA進行改造,增加了大量新功能后,第二代對象存儲ATMOS橫空出世。雖然AWS在2006年已經(jīng)發(fā)布了S3,但那時候還沒有成為市場主流。ATMOS采用RESTful API,兼容S3,還支持數(shù)據(jù)可讀寫,引入了多站點、多租戶等眾多功能,成為許多運營商提供云計算服務(wù)的首選。
2014年,對象存儲市場加速發(fā)展,呈現(xiàn)出新的格局,當(dāng)時S3已經(jīng)成了事實上的對象存儲標(biāo)準。ATMOS也與時俱進,進化到第三代對象存儲ECS,其特性、功能和數(shù)據(jù)服務(wù)能力持續(xù)提升。
“ECS并不是一個新產(chǎn)品,而是擁有多年的技術(shù)積累和突破。”胡淵汶表示,“ECS既能以純軟件的方式部署,也有軟硬件一體機的模式,在國外還有運營商基于ECS軟件在數(shù)據(jù)中心搭建一套對象存儲,為用戶提供S3云服務(wù)。”
ECS具備完備的功能,在性能、可靠性、彈性、靈活性,以及數(shù)據(jù)保護、管理和服務(wù)能力等方面優(yōu)勢明顯。特別需要指出的是,ECS可支持數(shù)據(jù)湖,一份數(shù)據(jù)同時服務(wù)多個應(yīng)用,減少數(shù)據(jù)拷貝和數(shù)據(jù)復(fù)制的成本,還可支持直接數(shù)據(jù)分析,無需NAS網(wǎng)關(guān);具有Box-carting歸并功能,顯著提高小對象的磁盤利用率和性能;具備元數(shù)據(jù)檢索和搜索功能;SSD元數(shù)據(jù)加速,顯著提升系統(tǒng)整體性能;ECS具有獨特的故障恢復(fù)機制,對于節(jié)點和磁盤故障,僅依靠本數(shù)據(jù)中心內(nèi)的資源即可進行自愈,無需數(shù)據(jù)中心間的網(wǎng)絡(luò)流量,降低帶寬成本;ECS還支持WORM功能,避免數(shù)據(jù)誤修改,更好地滿足法規(guī)遵從要求;ECS還支持多數(shù)據(jù)中心部署架構(gòu),從任意數(shù)據(jù)中心均可訪問所有數(shù)據(jù),即使在數(shù)據(jù)中心故障時,其他數(shù)據(jù)中心仍能接管應(yīng)用訪問……
總之,ECS是經(jīng)過多年市場驗證的成熟、穩(wěn)定的對象存儲產(chǎn)品,具有值得信賴的數(shù)據(jù)安全性和持續(xù)運行能力,是企業(yè)級用戶實現(xiàn)對非結(jié)構(gòu)化數(shù)據(jù)保護的理想解決方案。
總有一款適合你
據(jù)胡淵汶介紹,ECS已與包括Cloudera、Oracle、Veritas等在內(nèi)的100多家廠商的軟件實現(xiàn)了集成,幾乎覆蓋了企業(yè)主要的應(yīng)用場景。
ECS可謂是對象存儲界的“百變星君”。ECS既可以獨自為戰(zhàn),作為企業(yè)極致的備份目標(biāo)設(shè)備,用于企業(yè)數(shù)據(jù)的備份和歸檔,其成本甚至比公有云更低,又能與戴爾科技集團以及合作伙伴的產(chǎn)品強強組合,滿足多種業(yè)務(wù)場景的需要。比如,ECS+戴爾PowerProtect DD,可將PowerProtect DD上變“冷”的備份數(shù)據(jù)轉(zhuǎn)移到成本較低的ECS上,從而釋放出 PowerProtect DD上的空間資源,降低整體架構(gòu)的成本。再比如,ECS+戴爾PowerScale,形成一個優(yōu)化的分層存儲組合,在PowerScale上的數(shù)據(jù)變“冷”以后,可以通過CloudPools將數(shù)據(jù)推送到ECS上,相當(dāng)于數(shù)據(jù)的歸檔,歸檔的數(shù)據(jù)可以復(fù)制部署到多地,實現(xiàn)容災(zāi)。諸如此類的靈活組合還有很多。
在對象存儲領(lǐng)域,戴爾科技集團處于領(lǐng)先地位。2020年10月,在Gartner公布的《分布式文件系統(tǒng)和對象存儲的魔力象限》中,戴爾科技集團處于領(lǐng)導(dǎo)者象限。
近些年,戴爾科技集團在對象存儲領(lǐng)域一直不斷推陳出新,形成了比較完善的產(chǎn)品線,可以滿足不同規(guī)模的用戶對性能、容量的不同需求,比如,適用于中小規(guī)模企業(yè)的EX300,將性能與存儲密度完美結(jié)合的EX500,還有適合大規(guī)模部署的EX3000等。特別值得一提的是,戴爾科技集團最新推出的EXF900,基于Dell EMC PowerEdge構(gòu)建,配備NVMe固態(tài)硬盤,每個節(jié)點可支持12~24個硬盤,集群的規(guī)模從每個機架230TB到2.94PB,能夠為大規(guī)模的現(xiàn)代化工作負載提供極致的性能。
除了作為備份和歸檔之用以外,戴爾ECS對象存儲在驅(qū)動現(xiàn)代化的工作負載,包括人工智能、機器學(xué)習(xí)、物聯(lián)網(wǎng)和分析應(yīng)用等方面,同樣展現(xiàn)出強大的能力。
對于每一個企業(yè)用戶來說,非結(jié)構(gòu)化數(shù)據(jù)的處理將是一項長期而艱巨的任務(wù)。選擇一個適合的對象存儲解決方案,以及一個技術(shù)和服務(wù)能力強大的合作伙伴是必須的。戴爾科技集團對非結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)架構(gòu)具有長期的遠景、戰(zhàn)略和投資,能夠為用戶提供文件、對象和流數(shù)據(jù)分析的完整且靈活的解決方案。相信戴爾ECS對象存儲“百變星君”的形象會隨著大量應(yīng)用場景的鋪開而更加清晰和令人印象深刻。
歡迎掃碼關(guān)注
總結(jié)
以上是生活随笔為你收集整理的对象存储界的“百变星君”来了,非结构化数据存储还是事儿吗?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 实时视频流:工作原理
- 下一篇: ubuntu 20.04 设定固定IP地