海量图片存储策略
一、常規圖片存儲策略
常規的一般400G下面的圖片存儲能夠採用比較傳統的分文件夾的形式
比如文件夾層級為? 年份/行業屬性/月份/日期/用戶屬性
有幾個比較重要的原則就是
1、單個文件夾下的文件個數不要超過2000個,多了尋址較慢,你在linux下ls就能看到數量太多的時候的效果了
2、文件夾層級結構不要太深,這樣server處理尋址較慢
二、海量圖片存儲策略
1、核心難點
(1)海量的意思就是圖片的數量級別是上億--光是我們建立索引就玩不轉,沒那么牛的庫存儲
(2)圖片總大小是依照T計算的--單個節點肯定支持不了
(3)圖片訪問非常easy有長尾效應--就是沒有所謂的熱點
2、解決方式
(1)、存儲方案
採用分布式隨即的方式將一些小文件存放到分布式集群環境中,用hash的方式來記錄位置(通常是先hash,然后確認存儲位置)。將位置直接作為文件名
?計算哈希的常見方法: hash(key)%n? =》大致的物理位置
分布式存儲常見方案:hdfs,tfs....
(2)、訪問方案(如果我們用apache)
硬訪問
直接讓apache依據文件名稱字找到指定文件存放位置,讀取文件流
軟訪問:
直接用apache的rewrite這個功能,將文件讀取
轉載于:https://www.cnblogs.com/mengfanrong/p/4028599.html
總結
- 上一篇: POJ-2386-Lake Counti
- 下一篇: Python 字符串笔记(转自木木)