Linux性能分析工具与图形化方法
歡迎大家前往騰訊云+社區(qū),獲取更多騰訊海量技術(shù)實(shí)踐干貨哦~。
作者:趙坤|騰訊魔王工作室后臺開發(fā)工程師
在項(xiàng)目開發(fā)中,經(jīng)常會遇到程序啟動時(shí)間過長、CPU使用率過高等問題,這個時(shí)候需要依靠性能分析工具來定位性能的消耗點(diǎn)。本文介紹三個常用的工具的入門級使用及圖形化方法,供大家參考。
本文介紹Perf、gprof和Valgrind三個性能分析工具,及其分析結(jié)果圖形化的方法,旨在讓大家更快的上手使用工具。出于篇幅的限制,本文不會對每種工具的使用參數(shù)及結(jié)果分析做詳細(xì)的介紹,只做入門級的使用說明,更多詳細(xì)的說明大家請Google一下。
每個工具的介紹會分成簡介、使用說明、圖形化方法三個部分。
每種工具的結(jié)果都會基于下面這段代碼:
#include <unistd.h>using namespace std;#define NUM 500000void init(int* int_array){ for(int i=0;i<NUM;i++){ int_array[i]=i; }}void accu(int* int_array,long& sum ){ for(int i=0;i<NUM;i++){ sum+=int_array[i]; usleep(3); }}int main(){ int int_array[NUM]; init(int_array); long sum=0; accu(int_array,sum);}這段代碼在普通PC上執(zhí)行了31s,最大CPU使用率為8.3%
Perf1.1 簡介
Perf是內(nèi)置于Linux內(nèi)核源碼樹中的性能剖析(profiling)工具。其基于事件采樣原理,以性能事件為基礎(chǔ),常用于性能瓶頸的查找與熱點(diǎn)代碼的定位。
1.2 使用
perf的使用可以分為兩種方式:
直接使用perf啟動服務(wù)
掛接到已啟動的進(jìn)程
第一種方式不需要root權(quán)限,第二種方式需要root權(quán)限
基于入門級使用這一前提,直接介紹一下使用方式:
perf record -e cpu-clock -g ./run 或者 perf record -e cpu-clock -g -p 4522使用ctrl+c中斷perf進(jìn)程,或者在程序執(zhí)行結(jié)束后,會產(chǎn)生perf.data的文件,使用
perf report會產(chǎn)生結(jié)果分析,如圖
1.3 圖形化方法
perf的結(jié)果可以生成火焰圖。生成火焰圖需要借助Flame Graph
Flame Graph項(xiàng)目位于GitHub:
https://github.com/brendangregg/FlameGraph
clone代碼或者直接下載壓縮包到服務(wù)器上。以壓縮包為例,是一個命名為:FlameGraph-master.zip的文件,假設(shè)其解壓后的目錄為:/data
基于1.2產(chǎn)生的perf.data,后續(xù)步驟如下:
1、使用perf script工具對perf.data進(jìn)行解析perf script -i perf.data &> perf.unfold 2、將perf.unfold中的符號進(jìn)行折疊:/data/stackcollapse-perf.pl perf.unfold &> perf.folded 3、最后生成svg圖:/data/flamegraph.pl perf.folded > perf.svg生成的火焰圖如下:
關(guān)于火焰圖的含義及分析網(wǎng)上有很多文章,這里不再贅述
Gprof2.1 簡介
gprof用于監(jiān)控程序中每個方法的執(zhí)行時(shí)間和被調(diào)用次數(shù),方便找出程序中最耗時(shí)的函數(shù)。在程序正常退出后,會生成gmon.out文件,解析這個文件,可以生成一個可視化的報(bào)告
2.2 使用方法
使用gprof,需要在編譯時(shí),加入-pg選項(xiàng)
另外只有在程序正常退出后才會生成gmon.out,kill進(jìn)程的方法是沒法生成gmon.out的。對于那些線程會一直run的服務(wù),需要修改代碼,讓程序在某個時(shí)間點(diǎn)停止。
重新編譯后,正常啟動程序即可;然后在程序運(yùn)行結(jié)束后,會生成gmon.out文件
使用如下命令,生成報(bào)名文件(其中run是二進(jìn)制的名字):
gprof -b run gmon.out >>report.txtreport.txt打開如下圖所示:
2.3 圖形化方法
gprof的結(jié)果文件需要借助gprof2dot.py和graphviz來展示
使用gprof2dot.py生成dot文件
python gprof2dot.py report.txt >report.dot需要說明的是,這里要求服務(wù)器已經(jīng)安裝了python,并且要求gprof2dot.py與安裝的python版本匹配。這兩者是否匹配是一個需要運(yùn)氣、并且解決起來很無聊的事情,我的服務(wù)器上安裝的python是2.6.6,第一次從網(wǎng)上下載的gprof2dot-2017.9.19與python版本就不匹配,執(zhí)行會出錯。目前使用的版本與2.6.6是兼容的,如果需要可以與我聯(lián)系。
dot的打開需要graphviz工具,我是在windows下安裝的graphviz,這個工具下載很簡單。下載后使用gvedit.ext打開前一個步驟產(chǎn)生的report.dot文件即可
這個圖顯的有些萌萌噠,這是因?yàn)槲覀兊某绦驅(qū)懙谋容^簡單,對于一般的業(yè)務(wù)而言,這個圖會比較復(fù)雜。
Valgrind3.1 簡介
valgrind不是linux的原生工具,需要自行安裝。valgrind自身包含了多個工具:
-
Memcheck:用于內(nèi)存泄漏檢查
-
Callgrind:用于性能分析,會收集程序運(yùn)行時(shí)間和調(diào)用關(guān)系
-
以及Cachegrind、Helgrind等
這里我們主要使用的Callgrind工具
3.2 使用方法
首先需要安裝valgrind:
http://valgrind.org/downloads/valgrind-3.12.0.tar.bz2
解壓安裝包后,順次執(zhí)行:./configue 、make、make install 就可以了
使用valgrind來分析性能,必須使用valgrind來啟動程序:
valgrind --tool=callgrind --separate-threads=yes ./run--separate-threads是指是否按線程來分別統(tǒng)計(jì),如果不加,會將所有線程的結(jié)果打到一個文件里;否則會按線程分別打印到不同文件里。
程序執(zhí)行結(jié)束后,會生成形如:callgrind.out.4263-01的文件。這個文件直接分析起來有些困難,必須借助圖形化的方式來瀏覽
3.3 圖形化方法
valgrind的圖形化需要借助kcachegrind.exe,大家可以自行下載,下載后在windows運(yùn)行即可。這是打開callgrind.out.4263-01的結(jié)果:
4工具比較
對于我們的需求:定位執(zhí)行時(shí)間最長、占用CPU最多的函數(shù) 來說,這三個工具都可以達(dá)到目的。但這三者之間還是有一定的差距:
4.1 啟動方式
Perf雖然可以掛接進(jìn)程但需要root權(quán)限。在普通權(quán)限下,Perf和Valgrind必須使用前綴啟動的方式來啟動程序,這在某種程度上會影響到程序的性能。我們在壓測的過程中發(fā)現(xiàn)使用Valgrind啟動的時(shí)候,可以支持的在線總?cè)藬?shù)比直接運(yùn)行程序要少很多。
4.2 程序侵入
Perf和Valgrind都不需要修改Makefile或者程序,但gprof需要重新編譯文件,并且對于線程一直run的服務(wù),還需要修改代碼讓其自然退出,這在一定程序上侵入了程序。但從對性能影響上來看,gprof可以最大限制的保留原程序的性能
4.3 結(jié)果展示
gprof的結(jié)果是一顆倒樹,這顆樹展示了從根到葉子的所有結(jié)點(diǎn)的時(shí)間消耗;perf的是一個金字塔,與gprof有異曲同工之妙;Valgrind的結(jié)果是一條單路,指出的是某條調(diào)用路徑上的時(shí)間消耗,并不是一個全局的展示。
4.4 監(jiān)控原理
這是一個很專業(yè)的話題,目前對三者的監(jiān)控原理還沒有摸的太透,所以這里暫時(shí)空著。大家有興趣可以先行研究。
問答
linux實(shí)時(shí)調(diào)度算法?
Linux中的多線程處理?
相關(guān)閱讀
Linux 常用性能工具簡介
常見Linux調(diào)優(yōu)命令和工具
性能優(yōu)化:Linux環(huán)境下合理配置大內(nèi)存頁
?
此文已由作者授權(quán)騰訊云+社區(qū)發(fā)布,轉(zhuǎn)載請注明文章出處
?原文鏈接:https://cloud.tencent.com/developer/article/1063652
轉(zhuǎn)載于:https://www.cnblogs.com/qcloud1001/p/8584077.html
總結(jié)
以上是生活随笔為你收集整理的Linux性能分析工具与图形化方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《构建之法》读后的疑惑
- 下一篇: 第四次测试--面向对象