Java 应用线上问题排查思路、常用工具小结
前言
本文總結(jié)了一些常見(jiàn)的線上應(yīng)急現(xiàn)象和對(duì)應(yīng)排查步驟和工具。分享的主要目的是想讓對(duì)線上問(wèn)題接觸少的同學(xué)有個(gè)預(yù)先認(rèn)知,免得在遇到實(shí)際問(wèn)題時(shí)手忙腳亂。畢竟作者自己也是從手忙腳亂時(shí)走過(guò)來(lái)的。
只不過(guò)這里先提示一下。在線上應(yīng)急過(guò)程中要記住,只有一個(gè)總體目標(biāo):盡快恢復(fù)服務(wù),消除影響。不管處于應(yīng)急的哪個(gè)階段,我們首先必須想到的是恢復(fù)問(wèn)題,恢復(fù)問(wèn)題不一定能夠定位問(wèn)題,也不一定有完美的解決方案,也許是通過(guò)經(jīng)驗(yàn)判斷,也許是預(yù)設(shè)開(kāi)關(guān)等,但都可能讓我們達(dá)到快速恢復(fù)的目的,然后保留部分現(xiàn)場(chǎng),再去定位問(wèn)題、解決問(wèn)題和復(fù)盤(pán)。
在大多數(shù)情況下,我們都是先優(yōu)先恢復(fù)服務(wù),保留下當(dāng)時(shí)的異常信息(內(nèi)存dump、線程dump、gc log等等,在緊急情況下甚至可以不用保留,等到事后去復(fù)現(xiàn)),等到服務(wù)正常,再去復(fù)盤(pán)問(wèn)題。
好,現(xiàn)在讓我們進(jìn)入正題吧。
常見(jiàn)現(xiàn)象:CPU 利用率高/飆升
場(chǎng)景預(yù)設(shè):
監(jiān)控系統(tǒng)突然告警,提示服務(wù)器負(fù)載異常。
預(yù)先說(shuō)明:
CPU飆升只是一種現(xiàn)象,其中具體的問(wèn)題可能有很多種,這
總結(jié)
以上是生活随笔為你收集整理的Java 应用线上问题排查思路、常用工具小结的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 你是一个合格的数据分析师吗?教你如何提升
- 下一篇: SpringBoot 源码解析 —— S