2022年薪百万赛道:高性能神经网络与AI芯片应用
隨著大數據的發展,計算機芯片算力的提升,人工智能近兩年迎來了新一輪的爆發。而人工智能實現超級算力的核心就是AI芯片。AI芯片也被稱為人工智能加速器,即專門用于處理人工智能應用中的大量計算任務的模塊。
2020年我國人工智能芯片市場規模約為184億元。未來5G商用的普及將繼續催生人工智能芯片的應用需求,中國人工智能芯片行業將快速發展,預計2023年市場規模將突破千億元。
那么,如何借助AI芯片來實現特定的任務,將是所有AI芯片產業人員必備的技能。
為此,貪心學院重磅推出《高性能神經網絡與AI芯片應用研修課程》,為想進入AI芯片行業的同學們提供一個可以大幅提升自身就業競爭力的選擇。
本課程會講解AI芯片相關知識、高性能網絡設計、通用芯片及專用芯片計算加速方法等專業技能,并結合優秀編譯器的架構和實現細節的講解,為學生構建高性能AI算法的軟硬件視角,能夠解決應用落地時神經網絡的優化和部署相關問題。
01
內容亮點
全面技術講解:課程涵蓋了輕量化神經網絡設計、神經網絡部署前的優化方法、神經網絡編譯器的設計模式和具體實現、神經網絡部署到芯片上的計算加速等全面的AI嵌入式芯片設計和應用相關人員就業必備的知識。
軟硬件相結合:本課程除了全面講解高性能神經網絡相關的知識技術外,還會指導學員在硬件上進行實操。
專家導師授課:課程導師為AI芯片行業專家,相關項目經驗十分豐富。
02
你將收獲
掌握神經網絡高性能實現的算法及工具
掌握通用芯片及專用AI芯片架構及網絡加速技術
掌握通用芯片及專用AI芯片神經網絡部署應用的實際案例
短期內對一個領域有全面的認識,大大節省學習時間
認識一群擁有同樣興趣的人、相互交流、相互學習
感興趣的請添加咨詢顧問
03
項目介紹
▌項目1
項目名稱:模型輕量化
項目內容描述:mobilenet、shufflenet、squeezenet等,模型量化、剪枝和蒸餾技術,網絡的計算量和內存分析的工具,主干網絡的輕量化,檢測網絡的輕量化,分割網絡的輕量化,不同框架提供的加速方案。
項目使用的數據集:COCO,ADE20k,ImageNet
項目使用的算法:模型量化,模型剪枝和模型蒸餾
項目使用的工具:python,c/c++,pytorch,tensorflow,distiller,ncnn
項目預期結果:學員掌握輕量化網絡設計準則,模型輕量化技術,能夠上手操作一 ?個網絡部署前的優化。
項目對應第幾周的課程:1~4周
▌項目2
項目名稱:神經網絡編譯器
項目內容描述:tvm,ncnn,mnn,tnn 各自的特點,對于神經網絡的優化方案,tvm的具體設備的優化方案,算子融合,路徑優化,內存優化,ncnn的網絡的表示數據結構,ncnn的一些優化計算的思路,量化方法,mnn中的數據結構,模型轉換和量化方法,tnn和ncnn的區別,系統架構,量化方法。
項目使用的算法:離線量化,在線感知量化
項目使用的工具:python,c/c++,tvm,ncnn,tnn,mnn
項目預期結果:學員對于神經網絡編譯器有全面的了解,對于主流神經網絡編譯器能夠實踐使用,完成模型到芯片所需要格式的轉換。
項目對應第幾周的課程:5~8周
▌項目3
項目名稱:通用芯片加速技術
項目內容描述:cpu,arm對應的指令集級別的加速,編譯器中具體的優化策略,simd,avx,sse,openblas,neon和cpu中對于卷積的運算加速方案,cpu上的具體實例,arm上的具體實例,環境配置,神經網絡的例子,加速方案的組合和實際效果。
項目使用的算法:simd,avs,sse,blas,winograd
項目使用的工具:nnpack,qnnpack,lowpgemm,tvm,ncnn
項目預期結果:學員深入掌握cpu,arm等芯片的神經網絡加速技術,并且通過一個例子來看具體的加速效果?。
項目對應第幾周的課程:9~12周
▌項目4
項目名稱:專用芯片加速技術?
項目內容描述:gpu和k210 npu及各自神經網絡編譯器中的加速優化技術,gpu上的cuda加速的方法,cublas,opencl,vulkan的開發例子,nncase上編譯一個網絡,k210開發板環境配置及人臉檢測模型的部署
項目使用的算法:人臉檢測
項目使用的工具(編程語言、工具、技術等):Python,C/C++,opencl,vulkan,nncase
項目預期結果:學員可以掌握gpu及npu上神經網絡的編譯加速,并且通過一個具體的例子來完成人臉檢測模型在k210芯片上的部署?。
項目對應第幾周的課程:13~16周
感興趣的請添加咨詢顧問
04
詳細內容介紹
第一周:輕量化網絡結構設計
本節課將講解網絡參數量、浮點運算數等模型評價指標、工具,以及分類網絡, 檢測網絡,分割網絡的輕量化設計。
課程提綱:
輕量化網絡設計背景介紹
網絡的計算量和內存分析工具
主干網絡的輕量化
檢測網絡的輕量化
分割網絡的輕量化
典型網絡的設計思路
第二周:知識蒸餾優化、低秩分解優化
本節課將講解神經網絡知識蒸餾優化、神經網絡計算低秩分解加速計算方法。
課程提綱:
知識蒸餾方法介紹
知識蒸餾原理和步驟介紹
知識蒸餾訓練方法縮減網絡的實際分類網絡演示
低秩分解原理
低秩分解加速計算在神經網絡推理中的應用
第三周:網絡剪枝
本節課將講解網絡稀疏性原理,網絡剪枝原則及剪枝的常見方法。
課程提綱:
網絡剪枝的原理
常用的剪枝策略
神經網絡框架中的剪枝功能介紹
剪枝的實際使用
第四周:網絡量化
本節課將講解網絡的低比特化,以及在AI芯片中的計算,實現網絡量化的離線和在線感知的量化方法。
課程提綱:
網絡量化的技術發展
不同離線量化算法的實現原理
神經網絡框架中在線感知量化算法的原理及實現
實際案例
第五周:神經網絡編譯器簡介
本節課將講解tvm、ncnn、tnn、mnn的簡要對比,tvm relay和網絡轉換,網絡的編譯優化和推理加速。
課程提綱:
tvm、ncnn、tnn、mnn的簡要對比
tvm relay和網絡轉換
網絡的編譯優化和推理加速
tvm的實際案例
第六周:ncnn
本節課將講解ncnn的系統架構圖,數據結構,支持的框架,網絡的表示,網絡優化,量化,以及各平臺的優化策略。
課程提綱:
ncnn的系統架構圖
ncnn的數據結構及支持框架
ncnn的網絡表示
ncnn網絡優化,量化,及各平臺的優化策略
第七周:tnn
本節課將講解tnn的系統架構圖,數據結構,支持的框架,網絡的表示,網絡優化,量化,以及各平臺的優化策略。
課程提綱:
tnn的系統架構圖
tnn的數據結構及支持框架
tnn的網絡表示
tnn網絡優化,量化,及各平臺的優化策略
第八周:mnn
本節課將講解mnn的系統架構圖,數據結構,支持的框架,網絡的表示,網絡優化,量化,以及各平臺的優化策略。
課程提綱:
mnn的系統架構圖
mnn的數據結構及支持框架
mnn的網絡表示
mnn網絡優化,量化,及各平臺的優化策略
第九周:cpu中的指令集優化
本節課將講解cpu中的指令集優化,simd、avx、sse方法,及tvm中對于cpu上神經網絡加速的位置。
課程提綱:
cpu中的指令集優化:simd,avx,sse方法
tvm中對于cpu上神經網絡加速的位置
第十周:arm中的神經網絡加速
本節課將講解arm中的neon優化,及ncnn,tnn和mnn的實現,并結合實際例子來看具體的加速效果。
課程提綱:
arm中的neon優化
ncnn,tnn和mnn實現的講解
具體加速效果的實際案例
第十一周:卷積計算的優化算法
本節課將講解卷積計算的優化算法,包括winograd等。
第十二周:神經網絡加速庫
本節課將講解openblas庫的優化,nnpack/qnnpack的優化,及lowpgemm。
課程提綱:
openblas庫的優化
nnpack/qnnpack的優化
lowpgemm
第十三周:gpu上神經網絡的運行和加速
本節課將講解gpu與cpu計算加速的區別,英偉達gpu的原生cuda加速方法,及推理側tensorrt的使用。
課程提綱:
gpu與cpu計算加速的區別
英偉達gpu的原生cuda加速方法
推理側tensorrt的使用
第十四周:gpu加速通用加速庫
本節課將講解通用加速庫cublas,vulkan,opencl的使用。
課程提綱:
通用加速庫cublas的使用
Vulkan的使用
opencl的使用
第十五周:dsp,fpga,npu專用加速計算
本節課將講解dsp,fpga,npu的專用加速計算。
課程提綱:
dsp計算加速
fpga計算加速
npu專用加速計算
第十六周:npu使用
本節課將以嘉楠科技的k210為例,實現一個人臉檢測案例。
課程提綱:
嘉楠科技k210芯片介紹
nncase人臉檢測案例
感興趣的請添加咨詢顧問
05
授課方式
基礎知識講解
前沿論文解讀
論文代碼復現
該知識內容的實際應用
該知識的項目實戰
該方向的知識延伸及未來趨勢講解
06
適合人群
大學生
編程及深度學習基礎良好,為了想進入AI芯片行業發展
在職人士
想進入AI芯片行業的算法或IT工程師
想通過掌握硬件技術,拓寬未來職業路徑的AI算法工程師
入學基礎要求
掌握python、C++開發,及深度學習的基礎知識。
07
課程研發及導師團隊
王歡
肇觀科技算法總監
華中科技大學模式識別與人工智能碩士
原拼多多、同盾科技等公司算法工程師,AI算法領域從業15+年
藍振忠
課程研發顧問
ALBERT模型的第一作者
西湖大學特聘研究員和博士生導師
Google AI實驗室科學家
美國卡耐基梅隆大學博士
先后在NIPS, CVPR, ICCV, IJCAI等會議發表30篇以上論文,1000+引用次數
Jerry Yuan
課程研發顧問
美國微軟(總部)推薦系統部負責人
美國亞馬遜(總部)資深工程師
美國新澤西理工大學博士
14年人工智能, 數字圖像處理和推薦系統領域研究和項目經驗
先后在AI相關國際會議上發表20篇以上論文
李文哲
貪心科技CEO
美國南加州大學博士
曾任獨角獸金科集團首席數據科學家、美國亞馬遜和高盛的高級工程師
金融行業開創知識圖譜做大數據反欺詐的第一人
先后在AAAI、KDD、AISTATS、CHI等國際會議上發表過15篇以上論文
感興趣的請添加咨詢顧問
08
歷屆學員去向
總結
以上是生活随笔為你收集整理的2022年薪百万赛道:高性能神经网络与AI芯片应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: NeurIPS'20 | 通过文本压缩,
- 下一篇: 预训练卷不动,可以卷输入预处理啊!