Zabbix监控流量异常(偶尔超出交换机限制)
前提:
近期業務做了集群的流量匯總,整體沒有問題。后面慢慢優化一些參數項。但是這兩天發現,集群流量數據增大,業務正常。
問題:
zabbix和prometheus 監控網卡,流量異常增大,超出限制,每次2分鐘,偶爾性觸發
看圖,這個和7月對比,簡介翻了幾倍,但是業務沒有增長,這就很奇怪了
?
?
上面介紹相關截圖。
解決:
首先以為業務導致網卡過大加載,導致流量增大,我們使用? ifstat-1.1.tar.gz? 工具記錄每一秒的網卡速度,記錄一晚上再看。
分析上圖,雖然流量有超過100M的,但是網卡是能夠支撐的。沒有zabbix和prometheus顯示的那么恐怖。
思考
我和大佬分交流一下。說是zabbix的單位轉換,要加8倍,我也是添加了的
?
?
嗯。。。。。。。。。。。。。。。。。。。。。正常
大佬建議讓我使用snmp監控對比一下,思路不錯,可以搞。直接部署上去對比了
分析
snmp對比一下
?zabbix的(還是這么高)
snmp的(這個是正常的)
?很明顯,這是snmp是準確的。但是為什么會這樣
結果:
首先,業務正常,服務器正常,現在就是zabbix不正常,懷疑是zabbix的問題
回想一下,在數據量增加前做了什么操作。
之前,我當時增加一批監控指標,因為監控點比較重要,所有設置抓取時間為10s。誰知道這個10s就是罪魁禍首。集群內部機器較多,可能會產生數據積壓。
后續
取消關聯模板,監控整體流量,確定無虛假流量
調整監控項的抓取指標為:1m? 再次關聯模板正常
總結
以上是生活随笔為你收集整理的Zabbix监控流量异常(偶尔超出交换机限制)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信怎样查绑定的服务器地址,你的微信绑定
- 下一篇: win7查看隐藏文件_win7 c盘清理