这些常见的分布式存储系统,你是否都了解?
來源 |?清平の樂
來源 | CSDN博客,責編 | Carol
頭圖 | CSDN 下載自視覺中國
一、數據存儲類型
一般情況下,我們將存儲分成了4種類型,基于本機的DAS和網絡的NAS存儲、SAN存儲、對象存儲。對象存儲是SAN存儲和NAS存儲結合后的產物,汲取了SAN存儲和NAS存儲的優點。
1.DAS
DAS將計算、存儲能力一把抓,封裝在一個服務器里。大家日常用的電腦,就是一個DAS系統。
2.NAS
如果將計算和存儲分離了,存儲成為一個獨立的設備,并且存儲有自己的文件系統,可以自己管理數據,就是NAS。所以NAS存儲可以被不同的主機共享。服務器只要提需求,不需要進行大量的計算,將很多工作交給了存儲完成,省下的CPU資源可以干更多服務器想干的事情,即計算密集型適合使用NAS。
3.NAS
計算和存儲分離了,存儲成為一個獨立的設備,存儲只是接受命令不再做復雜的計算,只干讀取或者寫入文件2件事情,叫SAN。
因為不帶文件系統,所以也叫“裸存儲”,有些應用就需要裸設備,如數據庫。存儲只接受簡單明了的命令,其他復雜的事情,有服務器端干了。再配合FC網絡,這種存儲數據讀取/寫入的速度很高。
但是每個服務器都有自己的文件系統進行管理,對于存儲來說是不挑食的只要來數據我就存,不需要知道來的是什么,不管是英語還是法語,都忠實記錄下來的。但是只有懂英語的才能看懂英語的數據,懂法語的看懂法語的數據。所以,一般服務器和SAN存儲區域是一夫一妻制的,SAN的共享性不好。當然,有些裝了集群文件系統的主機是可以共享同一個存儲區域的。
4.對象存儲
對象存儲大量使用在互聯網上,大家使用的網盤就是典型的對象存儲。對象存儲有很好的擴展性,可以線性擴容。并可以通過接口封裝,還可以提供NAS存儲服務和SAN存儲服務。
VMware的vSAN本質就是一個對象存儲。
二、分布式存儲系統
普通存儲方案:Rsync、DAS(IDE/SATA/SAS/SCSI等塊)、NAS(NFS、CIFS、SAMBA等文件系統)、SAN(FibreChannel, iSCSI, FoE存儲網絡塊),Openfiler、FreeNas(ZFS快照復制)由于生產環境中往往由于對存儲數據量很大,而SAN存儲價格又比較昂貴,因此大多會選擇分布式存儲
GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。各自適用于不同的領域。它們都不是系統級的分布式文件系統,而是應用級的分布式文件存儲服務。
TFS
TFS(Taobao File System)是由淘寶開發的一個分布式文件系統,其內部經過特殊的優化處理,適用于海量的小文件存儲,主要針對海量的非結構化數據,它構筑在普通的Linux機器 集群上,可為外部提供高可靠和高并發的存儲訪問。目前已經對外開源;
TFS采用自有的文件系統格式存儲,因此需要專用的API接口去訪問,目前官方提供的客戶端版本有:C++/JAVA/PHP。
FastDFS
FastDFS是國人開發的一款分布式文件系統,目前社區比較活躍。如上圖所示系統中存在三種節點:Client、Tracker、Storage,在底層存儲上通過邏輯的分組概念,使得通過在同組內配置多個Storage,從而實現軟RAID10,提升并發IO的性能、簡單負載均衡及數據的冗余備份;同時通過線性的添加新的邏輯存儲組,從容實現存儲容量的線性擴容。
文件下載上,除了支持通過API方式,目前還提供了apache和nginx的插件支持,同時也可以不使用對應的插件,直接以Web靜態資源方式對外提供下載。
目前FastDFS(V4.x)代碼量大概6w多行,內部的網絡模型使用比較成熟的libevent三方庫,具備高并發的處理能力。
操作和部署過程:https://www.jianshu.com/p/b7c330a87855
HDFS
Hadoop 實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。Hadoop是Apache Lucene創始人Doug Cutting開發的使用廣泛的文本搜索庫。它起源于Apache Nutch,
后者是一個開源的網絡搜索引擎,本身也是Luene項目的一部分。Aapche Hadoop架構是MapReduce算法的一種開源應用,是Google開創其帝國的重要基石。
GFS(Google File System)
Google公司為了滿足本公司需求而開發的基于Linux的專有分布式文件系統。盡管Google公布了該系統的一些技術細節,但Google并沒有將該系統的軟件部分作為開源軟件發布。
原文:https://blog.csdn.net/ZZQHELLO2018/article/details/105660628
推薦閱讀
一文帶你認識keepalived,再帶你通關LVS+Keepalived!
那個分分鐘處理 10 億節點圖計算的 Plato,現在怎么樣了?
“谷歌殺手”發明者,科學天才 Wolfram
數據庫激蕩 40 年,深入解析 PostgreSQL、NewSQL 演進歷程
超詳細!一文告訴你 SparkStreaming 如何整合 Kafka !附代碼可實踐
5分鐘!就能學會以太坊 JSON API 基礎知識!
真香,朕在看了!
總結
以上是生活随笔為你收集整理的这些常见的分布式存储系统,你是否都了解?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenStack发布Ussuri版本
- 下一篇: 大横琴科技联合阿里云发布全国首个跨境服务