音视频技术开发周刊 | 157
每周一期,縱覽音視頻技術領域的干貨和新聞投稿:contribute@livevideostack.com。
內容推薦
SRT協議在電視直播中的應用
本文來自安徽廣播電視臺 直播技術工程師 張博力在LiveVideoStackCon 2020 線上峰會的演講,詳細介紹了SRT協議在信號傳輸、遠程制作等方面的應用,以及實際工作中遇到的相關技術問題。
https://mp.weixin.qq.com/s/qN54rJ53MetFL-GK7d6ptw
FreeSWITCH視頻會議“標準”解決方案
本文由FreeSWITCH 中文社區創始人杜金房在LiveVideoStack線上分享的演講內容整理而成,詳細介紹了FreeSWITCH做為一種開源的視頻會議解決方案如何在開源、開放的基礎上,對接各種無法修改的“標準”視頻會議終端、WebRTC瀏覽器以及微信小程序等,迎接各種挑戰。
https://mp.weixin.qq.com/s/LOCxUNBA1j94qJPqY1RKrA
架構
Qt5+FFmpeg實現同時采集屏幕+麥克風+系統音頻的錄屏軟件
windows下實現錄制屏幕,系統聲音,麥克風聲音成mpeg4(Win7及以上系統),并且實現音視頻同步和基礎UI界面。
https://blog.csdn.net/qq_34940879/article/details/107797504?utm_medium=distribute.pc_category.none-task-blog-hot-3.nonecase&depth_1-utm_source=distribute.pc_category.none-task-blog-hot-3.nonecase&request_id=
傳輸網絡
互聯網可靠實時協議RIST和SRT
使用SRT和RIST協議的場景很豐富,包括攝影機到基站的轉播、體育場轉播、新聞報道和云轉播等。
https://mp.weixin.qq.com/s/Dhz0jsHRiSrN7QZYPbxF_A
RIST –可靠的互聯網流傳輸
從任何地方上網似乎正越來越成為可能。當然,嚴格意義上講,這并不正確,但將互聯網連接到某個地方的選擇正在逐年增加。很快,5G將提供更可靠的接入互聯網的新方式,衛星互聯網的部署正在逐漸增多,ISP基礎設施繼續擴大。既然互聯網觸及了很多廣播公司想要的領域,為什么他們不把它用于視頻和音頻連接,代替專用線路呢?
https://mp.weixin.qq.com/s/mBTYr1MaEs2NffocByEsCg
完整雙流控制協議 (BFCP),SDP拓展和應用概論
本文將重點介紹通過SDP拓展實現的BFCP數據交互信息的方式和BFCP其他技術架構的討論,應用場景(例如物聯網IOT)和其他部署問題的討論。
https://mp.weixin.qq.com/s/w-SXoX_fPrzC0i4e_kxpOQ
ATSC3.0:新一代廣播標準
Jerald在文中介紹了ATSC3.0是一個全新的電視廣播標準,并簡單回顧了ATSC的發展歷程和重要性,指出現在的電視廣播協議中手機成為了主要的終端設備,并且還需要具有足夠強大的一對多廣播的能力。Jerald接著介紹了ATSC3.0是一個全IP的協議,并擁有傳輸多種動態視頻流的能力。
https://mp.weixin.qq.com/s/tOKFDU5Y0xr7qthCAl2dlQ
編解碼
創建商用AV1軟件編碼器的挑戰
本文討論了AV1在視頻和游戲的低帶寬流傳輸中的特定應用,針對性能受限的解碼器調整編碼的重要性以及使用機器學習技術調整視頻壓縮參數的重要性。
https://mp.weixin.qq.com/s/E2OcEhzbCotpA13CRkGoGg
中國的大學可以塑造視頻以及其他領域的未來,如果他們獲得了正確的知識產權
關于VVC的專利,中國公司和大學非常活躍。
https://www.iam-media.com/frandseps/chinese-universities-can-shape-future-of-video-and-plenty-more-besides-if-they-play-ip-right
音視頻技術
音視頻元數據那些事
本文主要介紹音頻AAC、視頻H264和H265等編碼格式的元數據,以及它們在MediaCodec中的處理邏輯和在封裝容器中的存儲邏輯。
https://juejin.im/post/6858809474820997127
視頻字幕技術及案例
演講主要介紹了自動語音識別(ASR),以及如何將其應用于視頻和音頻內容的字幕;描述了當今各種字幕方法的利弊;討論美國監管字幕環境,其預期的未來和處罰;探索監管環境將如何影響內容創作者、內容發布者(網站,廣播公司等)、場地設計師和業主、系統集成商;概述ASR的一些新優點。
https://mp.weixin.qq.com/s/M092snvVUCzSEOEa4S6ndA
人物專訪
“非洲用戶的付費意愿并不低”—— 專訪四達時代研發總監張亮
2018年世界杯前,StarTimesOn App在非洲正式上線,全程直播32個球隊的64場比賽,獲得了廣泛的關注和大量用戶。在非洲的網絡條件下,交付良好的視頻播放體驗絕非易事,所以這幾年張亮的工作就是從各個角度探索問題的解決方案,以保障非洲地區的視頻播放體驗。
https://mp.weixin.qq.com/s/HWAwb-9cpNzYD1S7Zr0rlw
AI智能
一個眼神都不放過,FRL公布自然表情系統MCA
通常,頭像是一個社交平臺的重要元素之一。而在目前大多數VR社交應用中,大多數虛擬頭像都比較卡通風,還達不到像人那樣真實。因此,為了打造更逼真的VR頭像,社交媒體和科技巨頭Facebook一直在打造一個叫Codec Avatar的系統。
https://mp.weixin.qq.com/s/EaDQwf19WtHOompcMhUmKQ
GitHub Repository,讓計算機視覺開發更上一層樓
如今,計算機視覺在許多領域都被廣泛應用,且進展非凡。但是計算機視覺的準入門檻對初學者較高,為了對廣泛的受眾更加友好,微軟將多年在計算機視覺領域工作中對處理現實世界問題的代碼和心得,都放到了一個開源的 GitHub Repository(以下簡稱 GitHub Repo)中供更多人使用。
https://mp.weixin.qq.com/s/WEBLwo_3xio0l1euArZjfQ
圖像
MMEditing:多任務圖像視頻編輯工具箱
我們近期在 OpenMMLab 項目中開源了MMEditing。這是一個圖像和視頻編輯的工具箱,它目前包含了常見的編輯任務,比如圖像修復,圖像摳圖,超分辨率和生成模型。在編輯圖像或者視頻的時候,我們往往是需要組合使用以上任務的,因此我們將它們整理到一個統一的框架下,方便大家使用。
https://mp.weixin.qq.com/s/9mdWJ25eBAkXeHdYEbNEEg
資源推薦
抖音直播的禮物特效引擎
為了直播事業的蓬勃發展,我們開源了抖音直播的禮物特效引擎,拋磚引玉,歡迎各位交流討論。
https://github.com/bytedance/AlphaPlayer
吳恩達推薦筆記:22張圖總結深度學習全部知識
195篇NAACL+295篇ACL2019有代碼開源的論文。
https://github.com/yizhen20133868/NLP-Conferences-Code
活動推薦
【8折倒計時】全年唯一一場音視頻線下大會,我們在北京等你來High
線上學習、遠程辦公、在線參會……歷經了半年多的時空隔閡,我們決定10月31日-11月1日在北京舉行一場音視頻領域的線下聚會,這里有你認識的老朋友,也有許多新鮮面孔,但最重要的是原汁原味的技術干貨,最新視頻編解碼標準與算法優化、如何應對復雜網絡環境、AI與多媒體技術的落地實踐……
吳端培? 思科? 首席架構和軟件工程師? 《大規模分布式實時視頻會議與流媒體:架構設計、問題與解決方案》
孫立峰? 清華大學? 計算機科學與技術系教授 《AI 輔助的互聯網視頻分發與傳輸:趨勢、挑戰與實踐》
陳勁松? VIPKID? 音視頻架構師 《VIPKID音視頻中臺演進之旅》
徐邁? 北京航空航天大學? 教授、博士生導師? 《數據驅動下的壓縮視頻增強》
劉建永? 美團? 軟件研發工程師? 《美團通訊平臺接入RTC應用實踐》
點擊【閱讀原文】了解更多講師及話題信息
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 157的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SRT协议在电视直播中的应用
- 下一篇: LiveVideoStackCon 北京