最全 Prometheus 踩坑集锦
生活随笔
收集整理的這篇文章主要介紹了
最全 Prometheus 踩坑集锦
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
監控系統的歷史悠久,是一個很成熟的方向,而 Prometheus 作為新生代的開源監控系統,慢慢成為了云原生體系的事實標準,也證明了其設計很受歡迎。本文主要分享在 Prometheus 實踐中遇到的一些問題和思考,如果你對 Kubernetes 監控體系或 Prometheus 的設計還不太了解,可以先看下容器監控系列[1]。
幾點原則
-
監控是基礎設施,目的是為了解決問題,不要只朝著大而全去做,尤其是不必要的指標采集,浪費人力和存儲資源(To B商業產品例外)。
-
需要處理的告警才發出來,發出來的告警必須得到處理。
-
簡單的架構就是最好的架構,業務系統都掛了,監控也不能掛。Google SRE 里面也說避免使用 Magic 系統,例如機器學習報警閾值、自動修復之類。這一點見仁見智吧,感覺很多公司都在搞智能 AI 運維。
Prometheus 的局限
-
Prometheus 是基于 Metric 的監控,不適用于日志(Logs)、事件(Event)、調用鏈(Tracing&#
總結
以上是生活随笔為你收集整理的最全 Prometheus 踩坑集锦的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SpringBoot 源码解析 —— S
- 下一篇: Flink从入门到精通100篇(十一)-