DataSketches HLL Sketch module
生活随笔
收集整理的這篇文章主要介紹了
DataSketches HLL Sketch module
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
上圖是官網的介紹,翻譯后的意思是此模塊提供Apache Druid聚合器為不同的計數基于HLL sketch來自datasketches數據庫。攝入的時候這個聚合器創建HLL sketch對象存儲在Druid的segments中。在查詢的時候sketches被讀取并且被合并到一起。最后默認情況下,你可以收到提交給sketch的不同值的估計值。此外,還可以使用post聚合器在同一行中生成sketch列的聯合??梢詫θ魏螛俗R符的列使用HLL sketch聚合器。它將返回列的估計基數。
要是想要使用此聚合器,在配置文件中必須要包含:
druid.extensions.loadList=["druid-datasketches"]聚合器示例:
{"type" : "HLLSketchBuild","name" : <output name>,"fieldName" : <metric name>,"lgK" : <size and accuracy parameter>,"tgtHllType" : <target HLL type>,"round": <false | true>} {"type" : "HLLSketchMerge","name" : <output name>,"fieldName" : <metric name>,"lgK" : <size and accuracy parameter>,"tgtHllType" : <target HLL type>,"round": <false | true>}參數的類型及對應的含義:
post的聚合器:
估計:返回不重復計數估計值的兩倍
{"type" : "HLLSketchEstimate","name": <output name>,"field" : <post aggregator that returns an HLL Sketch>,"round" : <if true, round the estimate. Default is false> }有界的估計:返回HLL sketch中不同的估算數和誤差范圍結果將是一個包含三個雙精度值的數組:估計值、下界和上界。邊界以給定的標準差數提供(可選默認是1)。該值必須是1、2或3的整數值,對應約68.3%、95.4%和99.7%的置信區間。
{"type" : "HLLSketchEstimateWithBounds","name": <output name>,"field" : <post aggregator that returns an HLL Sketch>,"numStdDev" : <number of standard deviations: 1 (default), 2 or 3> }聯合:
{"type" : "HLLSketchUnion","name": <output name>,"fields" : <array of post aggregators that return HLL sketches>,"lgK": <log2 of K for the target sketch>,"tgtHllType" : <target HLL type> }sketch to string:
{"type" : "HLLSketchToString","name": <output name>,"field" : <post aggregator that returns an HLL Sketch> }總結
以上是生活随笔為你收集整理的DataSketches HLL Sketch module的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: js设置button和input不可点击
- 下一篇: 计算机无法共享的原因,不能共享的原因