2021 音视频技术趋势不完全预测
The Economist (經濟學人)在 The World in 2021 特別刊的編者序中寫到:“21?是一個與好運、冒險、機遇和擲骰子有關的數字 —— 它是一個標準骰子六面數字相加的總和(即前6個自然數——1 + 2 + 3 + 4 + 5 + 6 = 21——的和,也稱三角形數)”。
維基百科又告訴我們,21 是庫德族旗幟中太陽光線的數量;是化學元素鈧的原子序數;是斐波那契數列的最小非平凡數;是用于 FTP 連接的標準 TCP/IP 端口號。
此外,21 克還被認為是靈魂的重量。
所有這一切都離奇地應和著這個不同尋常的年份 ——?2021,它帶著巨大的不確定性由遠及近—— 風險沒有變小,但吹來了新的風口,帶來了新的需求 —— 需求刺激著市場,出現了新的商機 ——?而技術本身,也由此開始加速迭代。
以下是 LiveVideoStack 最為關注的2021年(不完全)音視頻技術趨勢,也是LiveVideoStackCon 2021 上海站?——??新技術,新機會 —— 聚焦的技術熱點。
關于邊緣計算,大部分人都不會否認它代表的未來,不僅因為集中式架構面臨巨大的網絡成本,也因為用戶對時延愈發苛刻的需求。但要實現邊緣與中心協調的架構,需要時間和平臺方更多的投入 —— 就像AWS等云廠商在云計算初期面臨的挑戰一樣。
5G等基礎設施的建設將為邊緣計算打下關鍵的基礎;關鍵應用場景和殺手級應用也將真正成為驅動邊緣計算發展的一股力量:如工業領域對網絡時延的需求,云游戲對海量邊緣計算節點的需求,超高清或VR視頻對超高帶寬的需求等等。
本次 LiveVideoStackCon 2021 上海站,將有更多邊緣計算相關的當下業務場景及其未來應用實例的技術分享。
實時音視頻通訊、云游戲、超高清視頻、VR/AR等應用與場景的落地和商業化,都離不開端到端低延時的支持。而想要實現超低延時,不僅體現在終端設備的迭代升級、硬件加速以及底層Codec的不斷優化,網絡架構的升級、傳輸協議的優化、鏈路策略的選擇等等都是至關重要的因素。
5G、8K 時代的到來(或即將到來),不僅帶來了傳輸帶寬、終端運算能力的提升,VR/AR、沉浸式、高自由度視頻技術等也得以快速發展。從高幀率到高分辨率,再到如今的 HDR,我們不斷追求最極致的畫質,這又進一步帶來了全新的真實現場感和交互式體驗。目前來看,AR/VR 在許多教育、培訓場景下已經得到驗證,并且正在向泛娛樂領域過渡,也許在未來 1-2 年內,VR 效果的短視頻觀看體驗就會得到普及。
如今,似乎每一個軟件投資和產品公關都要提及“無代碼”平臺或功能。與云計算類似,無代碼本身也不是一個固有類別,而是用戶與軟件工具交互方式的轉變。就像PC普及了軟件的使用、API 普及了軟件連接、云普及了軟件的購買和部署一樣,無代碼或許能夠通過普及特定的技術技能來引領下一波企業創新。?
快手與聲網等互聯網公司也都成立了專門的團隊進行“無代碼/低代碼”項目的研發。
“低代碼(Low Code)”和“無代碼(No Code)”經常被互換地提到,但它們的概念卻截然不同。低代碼和無代碼都抽象了底層代碼及其技術性,低代碼旨在通過有限的抽象提高開發人員的效率,而無代碼則想通過更強大的抽象來增強開發人員和非技術人員的能力。
根據Forrester Research, 截至2020年,84%的企業已經開始使用低代碼/無代碼技術,Gartner預測,到2024年,低代碼/無代碼將占到所有應用程序開發的65%。
一直以來,與音頻相關的技術(無論硬件軟件)分享都較為小眾,但人耳對聲音品質的追求卻越來越高:無論是RTC場景下的 AI 降噪、回音消除,還是針對 TWS 耳機的數字信號處理以及更加未來向的音頻 VR 技術,都在越來越多地受到關注與重視。目前為止,針對 RTC 場景的音頻算法與傳輸,還沒有一個通用的解決方案與評測標準,但與此同時,我們也看到了各家在音頻技術上越來越多的投入。
在本次上海站的“音頻新體驗”專場,我們首次將音頻專題擴展為全天 7 個場次,分為硬件與軟件兩個半天的場次,內容涉及云視頻會議的音頻體驗、基于深度學習的噪聲控制、手機播放端及硬件系統的音頻算法、支持多平臺多語言的自動口型生成項目,以及后續(春節后)將會陸續確定的更多講師與分享議題(敬請期待)。
隨著視頻內容需求的飛速增長,其在網絡上的傳輸量也越來越大——動輒幾十、上百兆的碼率,這對視頻編解碼算力提出了更高的要求。對比 GPU、FPGA、ASIC 等硬件方案,從延時控制及能耗等方面觀察,ASIC 加速看上去是更好的選擇,但定制化特性又使得它的前期投入不容小覷。因此,GPU 和FPGA?在特定場景下依舊保持著不可或缺的優勢與地位。
伴隨多媒體技術的日新月異,內容形式與需求也在不斷變化與增長,抖音、快手、B站等視頻平臺的崛起,極大滿足了人們的精神需求,然而內容生產往往受限于創作者的精力與想象力,難以高頻度持續供給優質內容。從Google的?url2video?到百度的 VidPress,從NLP、TTS到網易AI生成歌曲《醒來》,多媒體技術革新正將自動化智能生產推向人們的日常生活,并提供了更多元、更有趣的音頻與視頻內容。與此同時,未來多媒體消費的不斷升級,也將推動自動化生產工具迎來更加快速的發展周期與更優質的內容體驗。
低時延流式數據處理框架、嵌入式軟件媒體處理框架、OWT、FFmpeg、Gstreamer、SRS、WebRTC、VVC、AV1......
No need to?say?more.
最后借用微幀科技的聯合創始人&CEO 朱政老師為 LiveVideoStackCon 2021 上海站? “技術商業策略” 圓桌所寫的專題描述做結尾:
“疫情的風暴席卷全球,改變著人們的生產和生活方式。許多公司在艱難中尋求發展,也有許多公司在蓬勃中站上浪尖。視頻的大時代在加速到來,多媒體新技術、新產品、新應用不斷迸發。浪淘風簸,如何在激烈的挑戰中尋找機會?吹盡狂沙,如何將技術轉換為商業價值?”
2021, LiveVideoStack 希望陪你一同不斷前行,尋找答案。
LiveVideoStackCon 2021 Shanghai
這個世界沒有“準備好”這一說
機會和技術不會主動敲開你的門
LiveVideoStackCon 2021?上海站
北京時間:2021年4月16日-4月17日
點擊【閱讀原文】了解大會詳情
總結
以上是生活随笔為你收集整理的2021 音视频技术趋势不完全预测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Netflix 付费用户达2亿、苹果VR
- 下一篇: 【线上分享】音频多麦盲分技术