有了 CPU 和 GPU,为什么还需要专门的 AI 芯片?
寒武紀所研發的芯片,更準確的描述其實是一類加快 AI 計算的“加速卡”,通常被稱之為“AI 芯片”,本質上是 ASIC(特定用途集成電路,Application Specific Integrated Circuit)。
這個拗口名詞的意思是,專門為某種用途而設計的集成電路系統。比如,比特幣挖礦熱潮中誕生了專門為“挖礦”而生的 ASIC,而寒武紀的 ASIC 則是針對 AI 算法所設計,由于犧牲了通用性,因此其市場增長完全依賴于 AI 的應用前景。
ASIC 好比專才,有某一方面的特長。而 CPU 和 GPU 更像通才,能干很多事,也有其專長領域,但和 ASIC 特長的方面比,是比不過的。
具體到 AI 計算上,ASIC 勝在運行 AI 算法速度快,同時功耗(耗電量)低。而 CPU 由于最初設計思路的限制,在 AI 計算上速度極慢,要想加快速度,只能堆砌更多 CPU。
CPU 速度不行,就有不少公司用 GPU 來加速 AI 計算,發現算得也挺快。但 GPU 畢竟不是專門為 AI 所設計,速度沒到極限,還有提升空間,而且它的價錢可不便宜,功耗也高。
Google 的圍棋 AI 程序“AlphaGo”當時用了 1200 個 CPU 和 170 個 GPU 來計算,還需要一個專門的機房、大功率的制冷空調和專人維護。而采用 ASIC,則只需要一個盒子大小,功耗也大幅降低。
說到底,CPU 和 GPU 都不是為 AI 計算而設計的,它們身上還肩負著其他任務,因此具備了大量其他的能力,而這些能力對 AI 算法來說根本用不上。各行各業都逐漸采用 AI 算法的同時,必定要找到一種速度快、功耗低且價格不貴的算力解決方案,ASIC 就是目前主流選擇之一。
AI 芯片如何落地?
AI 芯片總要有個落地的載體,也就是說它總得用在什么地方,才能產生價值。目前,主流的落地載體無非三個:終端、云端(即數據中心)和邊緣端。
終端是指普通消費者可以直接使用的設備,比如手機和智能手表。云端通常說的是數據中心,計算在數據中心統一處理,再通過網絡傳輸到終端設備上。
邊緣端介于云端和終端之間,簡單理解,它是在靠近數據源頭一側的千千萬萬的神經末梢節點上完成計算,而無需傳輸到一個統一的處理中心進行集中處理。因此它可以縮短延遲時間。邊緣計算一方面能彌補終端設備計算不足的短板,另一方面也可緩解云計算帶來的數據安全、隱私保護、帶寬和延時等潛在問題。
寒武紀的 AI 芯片布局,涵蓋了以上三個方面,并且研發了統一的基礎系統軟件平臺。
在終端,AI 芯片以被集成的方式存在。為了提升性能降低功耗,并且節省成本,終端 AI 芯片通常會通過授權 IP(知識產權)的方式,讓客戶將其集成到終端設備的 SoC(System on Chip,系統級芯片)上。
2017 年,通過 IP 授權的方式,寒武紀 1A 被集成到麒麟 970 上。而后,寒武紀 1H 又搭載在麒麟 980 上。
2018 年 5 月,寒武紀發布了思元 100,正式進軍云端 AI 芯片領域。2019 年,又推出了思元 270。該系列的下一款產品思元 290,已經處于內部樣品測試階段。值得一提的是,據寒武紀稱,這款產品基于 7nm 制造工藝設計。制造工藝是芯片制造的核心競爭力,數字越小表明性能越高且功耗越低。目前,世界上有能力設計 7nm 工藝的公司還比較少。
2019 年 11 月,寒武紀發布了邊緣 AI 芯片思元 220。自此,寒武紀完成了云邊端完整的 AI 芯片布局。
寒武紀所面臨的競爭
寒武紀在科創板上市后最大爭議在于,其主營業務的不確定性,以及激烈的市場競爭。
先看終端市場。寒武紀在終端 AI 芯片的切入點,主要是通過 IP 授權方式,嵌入到華為手機的 SoC 芯片里。據寒武紀招股書,2017 和 2018 年寒武紀終端智能處理器 IP 授權業務的收入,占主營業務收入的比例均超過 98%。
2019 年,這一比例驟降為不到 16%。這明顯的變化背后,是因為華為選擇讓旗下的半導體公司海思自研 AI 芯片,而寒武紀其他客戶的訂單規模遠不如華為。
拓展新的客戶也十分困難。據 Counterpoint 統計,2020 年 Q1 全球智能手機市場出貨量排名從高到低,分別是三星、華為、蘋果、小米、OPPO、vivo。這些手機廠商里,三星、蘋果和華為選擇自研 AI 芯片,小米、OPPO 和 vivo 則直接采用高通、聯發科或 Arm 的 AI 芯片。
寒武紀在招股書中特別提到:國內知名智能手機廠商絕大多數產品,現階段采用成熟手機芯片產品和方案,尚未大規模商用其自主研發的 SoC 芯片,該等廠商短期內不存在大規模采購公司處理器 IP 產品的需求。
在終端領域進展不順,云端 AI 芯片是寒武紀目前的主要收入支柱。云端 AI 芯片是一個巨頭環伺的市場,高通、阿里巴巴、華為和 Google 都已經發布了產品,但占有絕對優勢的卻是英偉達的 GPU。
雖然 GPU 不是最適合 AI 計算的芯片,但由于 AI 芯片研發需要時間,目前還處于開拓市場階段,所以現階段主流的 AI 訓練(神經網絡學習的過程)和推理(把神經網絡投入使用的過程)芯片,依然是 GPU。
在招股書中,寒武紀列出了同類產品的參數比較。可以看到,和寒武紀最新的思元 290 一樣,英偉達 A100 和華為海思 Ascend 910,都已經用上了 7nm 工藝。并且,英偉達 A100 的峰值性能高于寒武紀和華為海思最新產品,一定程度上會影響思元 290 獲取客戶。
所幸,隨著 AI 芯片的逐漸成熟,GPU 在云端 AI 芯片的市場份額會越發減少。Gartner 的統計數據顯示,全球 AI 服務器及 AI 芯片市場規模,自 2016 年到 2020 年都保持高速增長。而云端 AI 芯片當中 GPU 的市場份額呈持續下滑趨勢,預計到 2022 年云端訓練 GPU 占比將降至 60%,云端推理 GPU 占比更是只有 30%。
邊緣 AI 芯片方面,寒武紀在招股書中列出了和同類產品的比較。可以看到,寒武紀思元 220 的性能和功耗,并沒有能和英偉達 Xavier、華為海思 3559A、Ascend 310 拉開多少差距。甚至,英偉達和華為產品的制造工藝都是 12nm,要領先于寒武紀思元 220。
邊緣計算被視為下一個兵家必爭之地。幾乎在云端和終端有積累的廠商,都會推出相應的邊緣 AI 芯片。巨頭方面,除了英偉達和華為,還有 Google、高通。自動駕駛專用邊緣芯片領域有英特爾、地平線等,寒武紀面臨的競爭不可謂不激烈。
總的來看,AI 芯片是一個快速增長中的市場,不管是云端、邊緣端還是終端,寒武紀處于一條足夠長的“雪道”上。但這個市場里的競爭同樣激烈,英偉達的 GPU 依然占據優勢地位,華為、Google、高通、英特爾等巨頭伺機爭搶份額,還有一大批初創公司,寒武紀在“把雪球越滾越大”的過程中,阻力不小。
總結
以上是生活随笔為你收集整理的有了 CPU 和 GPU,为什么还需要专门的 AI 芯片?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 布衣柜用什么布料好,无纺布还是牛津布??
- 下一篇: 油画生命的起源是谁画的啊?