ES中的RollUp概念
生活随笔
收集整理的這篇文章主要介紹了
ES中的RollUp概念
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在最新的ES中出現了一個X特性,卷數據(Data Rollup,不知道如何翻譯,姑且這么稱呼吧)。這個卷數據是個什么概念呢?
如果做過監控(monitoring)的都知道,監控實際上是個大數據問題,這些”大“之一就是大量:一個復雜的系統可能每天面臨上TB的原始數據;雖然監控系統所用的數據庫都會有一些高效的壓縮功能,但最終磁盤上存儲的量仍然會按每天數十數百G增加。因此監控系統中數據的存留時間和策略(retention period & policy)始終是個核心問題。正是為了更好的解決這個問題,ES提出了卷數據這個概念(新瓶裝老酒了):把超過指定時間段的數據按預定的方式進行聚合,從而在一個更粗的粒度下能提供更長時間的數據存留以供查詢和處理。被卷處理后的數據可以根據實際情況被放到更低成本的存儲中以供不時之需或直接拋棄(當然也就從ES的index中去掉了)。
ES的卷數據有如下一些重要特征
使用卷數據可以帶來明顯的空間上的節約,但它也導致數據上的粒度或精度收到明顯的損失。更重要的是生成卷數據的方式是預先指定的,如果在后期查詢時發現所需要的數據在內容和格式上有缺失,因為原始數據已經被清除可能導致業務上的限制;此時如果將原始數據保存到了更便宜的存儲介質上,可以將他們重新加載出來后用新的格式對數據進行卷數據處理即可。
總結
以上是生活随笔為你收集整理的ES中的RollUp概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Elasticsearch等同八大全能型
- 下一篇: Java实体映射工具MapStruct