FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡
圖片逐漸成為互聯網主要的內容構成,相應的圖片處理需求也在高速成長,移動應用與用戶生產內容(UGC)正在驅動數據中心圖像處理的業務負載快速增加。本文深維科技聯合創始人兼CEO樊平詳細剖析了圖片加速的必要性、當前實際的圖片解決方案與部署方式以及如何通過FPGA+CPU異構計算的方案維護用戶體驗與服務成本新平衡。
文 / 深維科技樊平
整理 /?LiveVideoStack
1. 為什么需要圖片加速?
目前,圖片處理的需求正在快速成長,即源于用戶生成內容、視頻圖片抓取等方式的圖片縮略圖生成,像素處理,圖片轉碼、智能分析處理需求不斷增加。眾多應用迫切需要高性能,高性價比的圖片處理解決方案。
?
在這種情況下,數據中心面臨著一個核心的考驗 —— 即用戶體驗與服務成本之間的平衡。總地來說,目前存在的純CPU處理方案,TCO(服務器、電費、帶寬、場地人員 成本)相對高昂,用戶體驗也相對較差。
?
2. 解決方案
?
2.1 ThunderImage JPEG2JPEG縮略圖方案
?
鑒于此,深維科技推出了基于FPGA+CPU異構計算的解決方案——JPEG2JPEG,通過高性能FPGA分擔CPU處理任務,其所帶來的優勢是20倍吞吐性能提升,20倍延遲的降低,5倍實際成本的節省以及10倍的能效比提升。
?
?
JPEG2JPEG縮略圖方案是將用戶上傳的圖片進行高質量的縮放,即可滿足絕大多數應用場合需求,例如,微信接收的一般都是縮小后的圖片。縮略圖是一項大量的、高并發的需求,針對4K圖像輸入,輸出縮放至1024x768、640x480的場景。目前,JPEG2JPEG縮略圖方案可以實現吞吐量550張、延遲約58ms的高性能效果。
?
2.2 ThunderImage JPEG2WebP轉碼方案
?
?
WebP的需求主要來自于對帶寬成本的節省。WebP相較于JPEG在同等圖像質量情況下,壓縮率可以提升25%~34%,相應帶寬成本的節省更加明顯,并且因為傳輸數據量的減少,延遲也會隨之降低,進而帶來用戶體驗的提升。但與此同時,WebP也存在一些問題,其計算復雜度是JPEG的10倍,對服務器的性能要求也更高,進而造成部署成本的提升。
?
?
深維科技的ThunderImage JPEG2WebP轉碼方案,通過FPGA加速可以帶來10倍左右的性能提升,進而降低WebP的復雜度及服務器成本。ThunderImage JPEG2WebP轉碼方案支持Baseline、Main、Ultra幾種類型,實現了對WebP M4以及M6模式的支持,并且支持M4的比特級一致(與CPU參考軟件輸出結果每比特一致)。
?
3. 部署問題
?
實現了技術方面的突破之后要如何與生產環境集成呢?如何在實際的業務體系中實現對FPGA優勢更好的應用?實際部署是其中最值得探討與研究的方向。對此,深維科技進行了一系列的探索與嘗試,形成了以下幾種方案。
?
3.1 如何與生產環境集成
在云端,ThunderImage通常會與OBS進行集成,用戶端發送對圖片的請求,CDN檢查是否存在本地緩存,如不存在則向OBS發送請求,OBS通過相應參數與ThunderImage交互,生成相應的圖片格式,最終通過CDN返回給用戶端。這種與OBS集成的在線處理的方式,帶來的是帶寬成本以及存儲成本的降低,以及QoS的提升。
?
3.2 FPGA產品部署方面
?
?
目前,FPGA產品在部署方面可以劃分為公有云方案以及私有云方案兩種方式。深維科技目前所擁有的解決方案對行業輸出的產品形態主要分為公有云:SaaS、Instance以及鏡像服務;私有云以及線下產品:軟硬一體機。所應用的場景包括手機、電商、社交、CDN、云存儲、視頻等。
?
3.3 私有云部署方案
?
?
針對私有云部署,架構基于視頻加速卡的硬件環境,服務器上層相應的操作系統以及虛擬化處理相結合,覆蓋賽靈思驅動層、管理層工具等部分。深維科技的方案部署于此架構上,直接面向相應的應用場景。
?
3.4 Alveo U50部署方案
?
Alveo U50采用了UltraScale+架構,集成了超高帶寬的8GB HBM2存儲器技術,所以大幅縮小了產品尺寸。以此為基礎的方案是當前計算密度最高的處理方案,對于數據中心服務器升級來說更加便捷。
?
4. 案例分析
?
?
上圖為某社交網絡云相冊縮略圖生產的實際案例,單節點吞吐性能提升可以達到16倍,TCO可以降低到一半,并且具有更優質的服務質量體驗。因為其集群規模更小,所以維護起來更加方便。
?
4.1 公有云部署
公有云部署主要涉及平臺、功能以及服務幾個方面。其中云上的服務形態包括SaaS、Instance、Image三種。SaaS的優勢是易部署,起步費用較低,方便小規模用戶集成使用。Instance的集成更加靈活,封裝比較完整,成本相比SaaS更低。對于Image來說,購買云主機以及鏡像,需要在服務器端將應用與鏡像完美集成,這意味著我們有機會將整體方案的最好性能發揮出來,因此Image方式的性能是最強的,并且可以實現深度的定制。
?
4.2 某視頻網站WebP轉碼方案
?
?
上圖為某視頻網站WebP轉碼方案的實際案例,我們在云端上的整體性能都是有保障的,雖然云端的CPU為VCPU,在性能上會有些損耗,但整體性能收益一般情況下都會有20倍以上的性能提升。
?
綜上,深維科技ThunderImage圖像處理方案,支持豐富的編解碼算法,能夠適應差異化的應用場景,同時,無縫兼容業界常見算法平臺。高效便捷的應用體驗與部署方式,對于無論是公有云,私有云還是混合云端的應用來說都是一種新的優化與選擇。
關于深維科技
北京深維科技有限公司(簡稱深維科技)成立于2016年,由中國頂級FPGA軟件和硬件開發人員組成。 公司團隊在多媒體處理,HPC應用和異構系統架構設計方面擁有豐富的經驗。致力于成長為領先的異構加速應用領域FPGA計算平臺供應商,為更多行業和應用提供支持。
深維科技基于FPGA + CPU的異構計算技術,為數據中心應用提供超高性能的圖像和視頻處理解決方案和產品。除此之外,深維科技還為高性能計算和大數據應用,如存儲壓縮加速和地震勘探等應用提供解決方案和設計服務。
LiveVideoStackCon 2020
上海/北京/舊金山 講師招募
2020年LiveVideoStackCon將持續迭代,LiveVideoStackCon將分別在上海(6月13-14日),北京(9月11-12日)和舊金山(11月)舉行。歡迎將你的技術實踐、踩坑與填坑經歷、技術與商業創業的思考分享出來,獨樂不如眾樂。請將個人資料和話題信息郵件到 speaker@livevideostack.com 或點擊【閱讀原文】了解成為LiveVideoStackCon講師的權益與義務,我們會在48小時內回復。
總結
以上是生活随笔為你收集整理的FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RT-Thread智能音箱音频应用实践
- 下一篇: Quibi:我轻轻地咬一口 你最爱的Ne