cuda nsight 调试和性能分析
生活随笔
收集整理的這篇文章主要介紹了
cuda nsight 调试和性能分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
如果cuda需要調試需要在配置cmake:
cmake配置
set(CUDA_NVCC_FLAGS?-G;-g)
命令行編譯配置:
nvcc –g –G?MatrixCUDA.cu –o?MatrixCUDA
打開 nvidia nsight monitor ->options進行設置
2.盡量把WDDM TDR Delay 調大點
3.將 use this monitor for cuda attach 設置為true
現在就可以開始debug和性能分析了
設置斷點后,需要重新生成一下,點擊nsight
?
我們主要使用兩個功能: 1 :start cuda debugging(legacy) 2: start performance analyis
1:點擊start cuda debugging(legacy)就可以debug了
2.start performance analyis
需要勾選 trace setting cuda 才能分析
點擊 application control ->launch 開始運行 可以通過capture control 來控制開始停止
結束直接kill掉
總結
以上是生活随笔為你收集整理的cuda nsight 调试和性能分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL Binlog增量同步工具go
- 下一篇: Failed to connect to