数据中心加速,一文说清FPGA与GPU、ASIC目前的竞争格局
超大規模云計算中心、電子商務和社交網絡數據中心,正面臨著數據類型復雜的工作負載加速之難題。
數據中心加速的主要途徑
傳統CPU處理能力的需要突破已經成為共識,目前的途徑主要有以下幾類:
途徑一,ASIC:經歷了幾十年的發展演變,為專門目的而設計的ASIC,由于面向特定用戶的需求,在加速效率上可圈可點。但是,設計周期長、成本貴、應用范圍窄的通病,使ASIC僅適合于批量很大或者對產品成本不計較的場合。
途徑二,GPU:隨著近年來機器學習等領域的突飛猛進,GPU也早已經不再局限于3D圖形處理,其在浮點運算、并行計算等部分計算方面的特性已經引起業界越來越多的關注,尤其是目前最大的獨立芯片生產銷售商NVIDIA有些如日中天的感覺,但其在應用廣度上的通用性仍然有待時間的檢驗。
途徑三,FPGA:它作為半定制的ASIC而出現,既解決了定制電路的不足,又在性能與應用廣度上顯示出優勢,英特爾已經積極布局,推出CPU+FPGA架構,賽靈思池化FPGA近期取得的一些新成果,也使FPGA進入數據中心加速的主角地位。
賽靈思數據中心加速器取得重大進展
日前,賽靈思在2016全球超算大會(SC 16)上宣布推出一套全新的技術——賽靈思可重配置加速堆棧方案,旨在幫助全球最大的云服務供應商快速開發和部署加速平臺。通過賽靈思FPGA,該方案比x86服務器CPU提高40倍;比競爭型FPGA方案提高了6倍。
賽靈思全球戰略高級副總裁Steve Glaser和云戰略總監Andy walsh對賽靈思最新的FPGA動態可重配置堆棧技術進行了詳細的介紹。
超大規模工作負載中,賽靈思FPGA的單位功耗性能與CPU對比
與服務器CPU的性能對比,單位功耗性能在機器學習推斷方面提高了11倍;數據分析SQL查詢方面提升了33倍;視頻處理轉碼提高40倍;存儲壓縮提高40倍;網絡vSwitch可提高23倍。
在以計算效率和加速器利用率所組成的象限中,賽靈思池化FPGA的單位功耗性能實現了比Altera FPGA高2-6倍,相關產品將在明年上市。
數據中心加速主要途徑比較
問題一:賽靈思FPGA VS. 英特爾集成式MCM CPU+FPGA
賽靈思全球戰略高級副總裁Steve Glaser認為,在代表應用廣度的橫軸和加速器利用率的縱軸所組成的象限圖中,賽靈思池化FPGA在超大規模網絡應用方面已經遙遙領先;英特爾注意到FPGA的優勢,但其集成式MCM CPU+FPGA目前只能解決中小企業的問題。
問題二:賽靈思FPGA VS. 英偉達GPU
面對日益火爆的GPU,Steve指出,GPU和定制ASIC在應用廣度方面與FPGA相比遠遠不足;
以機器學習加速為例,使用神經網絡分類圖像、翻譯文本和語音、識別無結構數據中的底層模式,需要“兩階段”法。
第一階段(培訓),使用海量加標記的樣本數據和計算培訓神經網絡,英偉達GPU擅長的這一領域只占機器學習5%的市場規模。
一旦網絡培訓完成,便進入第二個階段(推斷),通過受訓的神經網絡處理新數據樣本或查詢,以確定其可能的級別。這一占機器學習加速90%的市場正是賽靈思FPGA角逐的天下。
推斷是當今最大規模數據中心中的一個巨大的工作負載,因為它負責實現廣泛的日益擴展的重要應用,例如語言翻譯、自然語言接口、照片和視頻內容識別,以及網上產品選擇與促銷。其中兩個最大的人工智能市場分別是無人駕駛汽車和機器人。
而賽靈思池化FPGA將機器學習推斷計算效率提升了2-6倍。
近年來賽靈思在加速領域的里程碑事件回顧
回顧一下賽靈思在云計算加速領域的重要里程碑事件:
賽靈思近年來在加速領域的里程碑事件
2014~2015年,賽靈思與高通、IBM等公司展開合作,并在業界推出首款20納米和16納米數據中心產品,比競爭對手提前了1年又1個季度。此外,賽靈思還積極推動制定行業標準的CCIX聯盟的發展。
目前,全球七大超大規模云服務公司中,已有3家采用了賽靈思FPGA,其中:
百度采用了賽靈思技術作為數據中心的池化資源部署,以及用于無人汽車和語音的機器學習;前不久,百度宣布利用賽靈思技術使序列分析提升了10倍。
微軟宣布,為實現服務器上的網絡加速,其數據中心已經大規模部署賽靈思FPGA技術搭建加速器架構,以分配越來越高的工作負載。
亞馬遜不久前公布在彈性計算云上實現了FPGA即服務。保險定價公司AON、基因序列測試公司edico genome、機器學習公司TERADEEP等亞馬遜合作伙伴都已經宣布采用了AWS F1實例。
初創型技術公司也是賽靈思重要的用戶類型之一。
DEEPHI TECH是一家初創公司,攜手賽靈思推出用于機器學習推斷的FPGA平臺,以及用于部署的超高效神經網絡,與GPU相比效能甚至提高了10倍。
使用賽靈思FPGA的單個服務器與整個機架的CPU性能對比
可重配置加速堆棧:行業標準的開發與部署
隨著互聯網和物聯網的大規模應用,未來很多工作負載將是今天的我們所無法想象的。
行業標準的開發與部署
賽靈思云戰略總監Andy walsh介紹,賽靈思可重配置加速堆棧的第一層平臺開發版在不久前已經推出,主要用于超大規模數據中心部署,以及基于云的開發環境。
在中間的應用開發層,賽靈思提供了集成框架;用于機器學習、分析和視頻的應用函數庫;以及針對UltraScale FPGA優化的數學函數庫。
在上層,賽靈思對OpenStack提供了支持,可進行云配置與管理;支持UltrascaleFPGA;2017年將推出Ocata 版。
賽靈思加速堆棧
“如果您是一家主攻機器學習推斷的公司,賽靈思池化FPGA是最佳的選擇。”Andy說。
點評:
賽靈思的優勢在于可編程,可優化,可重新配置。
機器學習的訓練在于浮點計算,這是GPU所增強的部分,但是這只占機器學習5%的工作,一旦進入大規模應用,GPU在推斷方面不足正是賽靈思FPGA的優勢,而這部分工作占了機器學習90%以上的工作量。在這一領域的成功,將為賽靈思帶來極高的市場地位。
在云計算與物聯網大爆炸的時代,隨著機器學習市場的逐步成熟,賽靈思的池化FPGA可重配置加速堆棧可謂是如魚得水,讓超大型網絡公司可以輕松地解決掉80%的工作。除了初創型公司,賽靈思把目標市場對準亞馬遜、Facebook、谷歌、微軟、阿里巴巴、百度和騰訊等“七大超級”數據中心公司,且已經獲得亞馬遜、微軟、百度等公司的認可,可以說,賽靈思已經在業界初步樹立起一流數據中心加速解決方案供應商的地位。
總結
以上是生活随笔為你收集整理的数据中心加速,一文说清FPGA与GPU、ASIC目前的竞争格局的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用gdb调试程序详解
- 下一篇: Ice笔记-利用Ice::Applica