线上CPU飚高(死循环,死锁……)?帮你迅速定位代码位置
top基本使用:
top命令參考本篇文章
查看內(nèi)存和CPU的top命令,別看輸出一大堆,理解了其實(shí)很簡(jiǎn)單
top 命令運(yùn)行圖:
?
第一行:基本信息
?
?
?
第二行:任務(wù)信息
?
?
?
第三行:CPU使用情況
?
?
?
第四行:物理內(nèi)存使用情況
?
?
?
buff/cache:
buffers 和 cache 都是內(nèi)存中存放的數(shù)據(jù),不同的是,buffers 存放的是準(zhǔn)備寫入磁盤的數(shù)據(jù),而 cache 存放的是從磁盤中讀取的數(shù)據(jù)
在Linux系統(tǒng)中,有一個(gè)守護(hù)進(jìn)程(daemon)會(huì)定期把buffers中的數(shù)據(jù)寫入的磁盤,也可以使用 sync 命令手動(dòng)把buffers中的數(shù)據(jù)寫入磁盤。使用buffers可以把分散的 I/O 操作集中起來(lái),減少了磁盤尋道的時(shí)間和磁盤碎片。
cache是Linux把讀取頻率高的數(shù)據(jù),放到內(nèi)存中,減少I/O。Linux中cache沒有固定大小,根據(jù)使用情況自動(dòng)增加或刪除。
第五行:交換區(qū)使用情況
?
?
?
Swap(內(nèi)存交換區(qū)):
是硬盤上的一塊空間。在內(nèi)存不足的情況下,操作系統(tǒng)把內(nèi)存中不用的數(shù)據(jù)存到硬盤的交換區(qū),騰出內(nèi)存來(lái)讓別的程序運(yùn)行。因此,開啟swap會(huì)一定程度的引起 I/O 性能下降(阿里服務(wù)器默認(rèn)不開)
第六行:進(jìn)程詳細(xì)信息
?
?
死循環(huán)
構(gòu)造的代碼如下:
@RestController @RequestMapping("top") public class ShowTopController {private Object lock1 = new Object(); private Object lock2 = new Object(); @RequestMapping("test")public String test() {return "success"; }@RequestMapping("loop")public String loop() {System.out.println("start"); while (true) {}}@RequestMapping("deadlock")public String deadlock() {new Thread(() -> {synchronized (lock1) {try{TimeUnit.SECONDS.sleep(1); } catch (Exception e) {}synchronized (lock2) {System.out.println("thread1 over"); }}}).start(); new Thread(() -> {synchronized (lock2) {try{TimeUnit.SECONDS.sleep(1); } catch (Exception e) {}synchronized (lock1) {System.out.println("thread2 over"); }}}).start(); return "success"; }}這里只介紹一下用到的top參數(shù)
參數(shù)選項(xiàng)名稱
含義
p
通過(guò)指定進(jìn)程ID(PID)來(lái)僅僅監(jiān)控某個(gè)進(jìn)程的狀態(tài)??梢灾付ǘ鄠€(gè),-pN1 -pN2 … (-p N1 -p N2…也可)或者 -pN1,N2,N3 …(-p N1,N2…也可)
H
顯示所有線程的運(yùn)行狀態(tài)指標(biāo)。如果沒有該參數(shù),會(huì)顯示一個(gè)進(jìn)程中所有線程的總和。在運(yùn)行過(guò)程中,可以通過(guò)H命令進(jìn)行交互控制
先手動(dòng)制造CPU飆高的場(chǎng)景,多執(zhí)行幾次,小編這里執(zhí)行3次
curl localhost:8080/top/loop執(zhí)行top
?
?
jstack命令工具可以得到線程堆棧信息,根據(jù)這些線程堆棧信息,我們可以去檢查Java程序出現(xiàn)的問(wèn)題
看到pid為23757的進(jìn)程CPU占用較高,執(zhí)行如下命令
jstack 23757 > loop.txt看看pid為23757的進(jìn)程中線程的具體情況
top -p 23757 -H當(dāng)然你也可以使用交互命令
top -p 23757然后再輸入H,效果和上面一樣
可以看到PID為23772,23773和23774的線程占用CPU較高
這里可能有人有疑惑,為什么線程也有PID啊?其實(shí)線程進(jìn)程都會(huì)有自己的ID,這個(gè)ID就叫做PID,PID是不特指進(jìn)程ID,線程ID也可以叫做PID
將10進(jìn)制的23772轉(zhuǎn)為16進(jìn)制,因?yàn)閖stack中PID用的是16進(jìn)制
printf "%x" 23772 輸出5cdc打開loop.txt文件,搜5cdc
可以看到線程一直在執(zhí)行ShowTopController中的第23行,即
while (true) {}好了定位到代碼中的位置了,當(dāng)然生產(chǎn)環(huán)境中肯定不會(huì)寫一個(gè)死循環(huán)的,有可能在特殊場(chǎng)景下出現(xiàn)死循環(huán),或執(zhí)行一個(gè)方法特別慢,用這種方法很快就能找到代碼位置。
死鎖
接著訪問(wèn)
curl localhost:8080/top/loop執(zhí)行
jstack 23757 > loop.txt打開loop.txt文件到最后
?
?
看到發(fā)現(xiàn)一個(gè)死鎖,死鎖代碼的位置描述的很清楚,生產(chǎn)環(huán)境發(fā)生的死鎖當(dāng)然沒有這么簡(jiǎn)單,所有學(xué)會(huì)用這些命令排查還是很有必要的
?
文章來(lái)源
?
轉(zhuǎn)載于:https://www.cnblogs.com/luchangjiang/p/10468449.html
總結(jié)
以上是生活随笔為你收集整理的线上CPU飚高(死循环,死锁……)?帮你迅速定位代码位置的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 小米路由器3C R3L 开发板固件,亲测
- 下一篇: 修改home下的中文目录为英文目录