模型加速(矩阵元素优化和cuba使用)
????????
參考文獻:
基于GPU的矩陣計算并行加速方法研究_李豐 哈爾濱工業大學博士論文
????????在工業級別中,為了提高機器學習模型運算的速度,甚至是可以犧牲一定的準確度。程序員想盡了一切辦法,一般從兩個方面去提高模型的運算速度,一方面是提高硬件的性能,另一方面是利用硬件的特點,盡量加快運算的速度,不斷優化算法。
接下來結合GPU的特點來說明矩陣加速的原理
GPU是專門為了圖像渲染設計的,所以一定很適合做矢量運算。
比如卷積運算,一般都用矩陣運算完成,所以深度學習一般都是用GPU去運算。
GPU是一個高度線程化的流式處理器組成的序列,一個GPU包含的流式處理器越多,就可以在同一時刻處理更多的任務。GPU架構如下:
GPU的并行是單指令多數據的并行,而很多計算問題又不可避免地出現數據依賴,因此GPU上的矩陣計算要處理數據依賴問題;?在解決數據依賴問題同時,也要提高計算資源的利用效率。
矩陣分為稀疏矩陣和稠密矩陣
接下來介紹CUBA(pytorch中常常用到cuba加快矩陣運算速度)
cuba可以利用NVIDIA系列顯卡對一些復雜的計算進行并行加速。
?利用cuba可以讓代碼既可以使用CPU執行,也可以用GPU執行。即使是有GPU的機器,它也不會自動使用GPU,而是需要在程序中顯示指定。調用model.cuda(),可以將模型加載到GPU上去。pytorch cuba官方使用文檔如下
https://pytorch-cn.readthedocs.io/zh/latest/notes/cuda/https://pytorch-cn.readthedocs.io/zh/latest/notes/cuda/
?
?
總結
以上是生活随笔為你收集整理的模型加速(矩阵元素优化和cuba使用)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 龙芯版办公软件下载
- 下一篇: win10宽带连接720错误 解决办法