TinyML设备设计的Arm内核
TinyML設備設計的Arm內核
Arm cores designed for TinyML devices
Arm推出了兩個新的IP核,旨在為終端設備、物聯網設備和其低功耗、成本敏感的應用程序提供機器學習的動力。Cortex-M55微控制器核心率先采用Arm的氦矢量處理技術,而Ethos-U55機器學習加速器則是該公司現有Ethos NPU(神經處理單元)家族的微型版本。兩個核心設計為一起使用,盡管也可以單獨使用。
在微控制器和其成本敏感、低功耗資源受限的設備上實現人工智能和機器學習應用被稱為tinyML領域。隨著5G的興起,終端設備的智能化趨勢開始顯現,tinyML有望以指數級的速度成長為一個包含數十億消費者和工業系統的市場。
“當回首五年后,可能都同意這一次標志著計算領域真正的范式變革,”Arm物聯網和嵌入式的高級主管thomasensergueix說。“在幾年內就看到了人工智能如何徹底改變了數據分析在云端的運行方式,大多數人口袋里都有一部人工智能增強型智能手機,現在是下一步,為各地的人工智能做好準備。”
智能家居設備,如智能音箱,將越來越能夠自己進行機器學習推理
機器學習,包括語音識別和計算機視覺應用,將越來越多地發生在微控制器中。一系列的微控制器替代品如雨后春筍般涌現,基于Arm內核和其處理器,Arm正瞄準這兩個新內核。
Ensergueix說:“知道,端點級別的所有數據都不能回到云端。“家庭或智能城市中的攝像機每天都會產生千兆字節的數據,而基礎設施并不是為這種上游數據流而建的。確信,需要的是擴展到數十億或萬億的物聯網終端,將需要直接在物聯網終端的人工智能推斷能力。需要安全?!?/p>
Cortex-M55
Cortex M-55是Arm著名的Cortex-M系列微控制器的最新補充,被設計成Arm最具人工智能能力的Cortex-M內核。
M55是第一款使用Arm新的氦矢量處理技術的機型,與前幾代Cortex-M相比,該技術的DSP性能提高5倍,ML性能提高15倍?;贏rmv8.1-M體系結構,可以創建自定義指令來針對特定的工作負載優化處理器,也許可以壓縮掉最后一次斷電。
結合M55和U55利用了M55增加的DSP馬力,可以用于信號預處理。然而,M55本身可以運行神經網絡工作負載。具有INT8數字的專用指令,包括在機器學習應用中常用的點積。
一個成功的AIoT應用“不僅取決于良好的計算性能,而且還取決于能否在正確的時間獲得正確的數據、正確的系數和正確的機器學習權重,因此處理器的內存接口已經過優化,能夠處理所有進出的數據。在這方面,比其任何Cortex-M核心都更有能力,”Ensergueix說。
Cortex-M55和Ethos-U55的組合對于手勢識別、生物識別和語音識別等應用具有足夠的處理能力。
Ethos-U55
Ethos-U55被稱為Arm的首款“微型NPU”,提供高達0.5的最高加速度(基于16nm或7nm等更小的幾何結構,運行頻率為1GHz)。Arm還沒有公布能效數據(TOPS/W)。是可配置的-可以使用32到256個乘法累加單元(mac)-有一個重量解碼器和直接內存訪問,用于動態權重解壓縮。
Ethos-U55加入了Ethos N77、N57和N37,相比之下,分別提供了4個、2個和1個TOP。性能可以通過使用多個etos內核進行擴展。
Cortex-M55和Ethos-U55設計用于一起使用,但也可以單獨使用。
M55和U55這兩個新的內核被設計為可以一起使用,可以比任何上一代Cortex-M設備更快地處理ML任務。Arm表示,與單獨使用Cortex-M7相比,使用ML的端到端語音助手應用程序的速度提高了50倍,而且功率效率提高了25倍。
Arm機器學習小組副主席史蒂夫·羅迪解釋說:“Cortex-M將運行應用系統代碼,然后當需要處理神經網絡工作負載時,該程序的命令流被放入SRAM中,向U55發出一個中斷,這里,開始執行這個命令流?!??!斑@可能是單一模型的單一推論。U55運行完成,將結果返回SRAM,然后讓Cortex-M接管。也可能是在處理流式數據(可能是音頻或視頻)時連續運行的情況?!?/p>
基于這些新核心的硅應該在2021年初上市。
總結
以上是生活随笔為你收集整理的TinyML设备设计的Arm内核的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 定制语音代理(智能体)的背后是什么?
- 下一篇: 先进机器人系统中的关键技术