音视频技术开发周刊 | 215
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉僅支持公眾號相關鏈接
許鍵樹:華為云視頻直播在各細分場景的體驗指標優化實踐
本文來自華為云媒體服務直播產品經理 許鍵樹在LiveVideoStack公開課的分享,結合華為云在直播領域的實踐經驗,詳細解析如何對直播卡頓率、秒開率、延遲等關鍵指標進行深度優化,以滿足各類直播場景的不同訴求。
以史為鑒,看媒體技術未來升級之路(LVS Meet Talk)
上周末受LiveVideoStack主編包研邀請,參加了LiveVideoStack Meet北京站的一場沙龍,做了一場“以史為鑒,看媒體技術未來升級之路”的演講,主題內容延續一貫以來不能算特別嚴謹的個人觀察和想法,也把當時的一些原稿放出來,大家多拍磚,求同存異。
LiveVideoStack Meet回歸北京站:未來會更卷吧?
9月25日,新回歸的LiveVideoStack Meet第一站在北京舉行,嘉賓們分享技術、趨勢與如何應對內卷的思考。
歷經5代跨越25年的RTC架構演化史
隨著移動互聯網普及和疫情疊加,實時通信技術(RTC)一時間成為炙手可熱的技術方向,RTC從1996年開始到如今已經發展成為一個非常復雜的技術領域,其包含了網絡傳輸、全局調度、媒體處理算法、媒體編解碼、信令協議、輸入輸出設備、Web、操作系統等相關的技術,至今為止發展了25年。這期間伴隨互聯網發展經歷了多次技術迭代,從網絡通信架構演化過程來看可把它分為5個階段(這里稱為5代),每個階段RTC從終端技術到通信架構都有大的技術變化。
靈光一現的創造——霍夫曼編碼
作為一名科學家和老師,我真的非常執著。如果我覺得自己還沒有找到問題的最簡單解決方法,我會非常不滿意,這種不滿會一直持續,直到我找到最佳方法為止。對我來說,這就是科學家的本質。——David Albert Huffman
用于 HTTP 自適應比特率流的高效多編碼算法
在這篇文章中,作者研究了各種多編碼算法(即多速率和多分辨率),并為大規模 HTTP 自適應流部署提出了新穎的多編碼算法。實驗結果表明,與獨立編碼相比,所提出的針對最高壓縮效率優化的多重編碼算法將整體編碼時間減少了 39%,比特率增加了 1.5%。與獨立編碼相比,其優化版本可最大限度地節省時間,將整體編碼時間減少 50%,比特率提高 2.6%。
基于CNN的質量感知環路濾波
本次演講主題為基于 CNN 的質量感知環路濾波,主講人主要闡述了一種基于卷積神經網絡的新型環路濾波器,用于提高 VVC 的編碼效率。在該濾波器中,通過為生成質量圖作為網絡的額外輸入,實現僅使用一個神經網絡模型處理所有不同質量和分辨率的視頻,同時保持編碼效率,降低整個網絡的復雜度。實驗結果表示所提出的方案在 AI 配置下實現了平均 6.27%、18.78% 和 20.42% 的 BD-rate 節省,在 RA 配置下實現了平均 5.18%、21.95% 和 22.13%的 BD-rate 節省。
音視頻終端引擎優化實踐
本文由百度智能云-視頻云終端技術架構師 ——李明路,在百度開發者沙龍線上分享的演講內容整理而成。內容從音視頻終端引擎的概念出發,梳理了音視頻終端引擎的發展和技術演進,重點介紹了音視頻終端引擎的關鍵技術組件,分享了開發過程中的經驗與實踐。
一層卷積能做啥?BOE告訴你:一層卷積可以做超分!
本文是京東方團隊關于端側超分的深度思考,以端側設備超分為切入點,對經典上采樣與深度學習超分之間的“空白”地帶進行思考,提出了一類“一層”超分架構(腦洞真的太大了),并對所提方案與其他輕量型超分方案以及bicubic從不同角度進行了對比,同時也為未來端側超分算法的設計提供了一個極具價值的參考點。
“智感超清”之HDR技術落地實踐
本文由百度智能云-視頻云音視頻處理技術架構師——邢懷飛,在百度開發者沙龍線上分享的演講內容整理而成。內容從百度智能視頻云的核心競爭力:“智感超清”出發,梳理了智能視頻云相關的產品概念和技術。在詳細介紹了HDR技術的概念基礎上,結合相關“智感超清”能力,重點分享了HDR技術的應用實踐。
提前90分鐘、一塊GPU一秒預測降雨概率,DeepMind ML天氣預報登Nature
借助機器學習,DeepMind 又在降雨預測領域「祭出了大招」。身處英國的頂級 AI 研究機構 DeepMind 近日與氣象機構合作撰寫并在《nature》上發表了一篇關于天氣預測的論文,指出人工智能有望在不斷變化的環境中幫助人們應對決策挑戰。
[ACM MM 2021] 基于深度學習的圖像水印去除
隨著互聯網時代的興起,圖片的版權保護得到了廣泛的關注;為了聲明圖片的所有權, 人們設計了各式各樣的水印圖片并以一定的透明度加注到原始圖片中。然而,加注水印的圖片也會存在一定的風險,即水印可以被圖像還原工具去除;由此,我們可以通過去除水印的程度評估圖片中的水印的有效性。本文介紹實驗室被ACM MM2021接受的一篇水印去除論文。
特斯拉自動駕駛中的AI技術
本視頻介紹了特斯拉自動駕駛中的AI技術。(中英字幕)
自動駕駛車輛在結構化場景中基于HD-Map由粗到精語義定位
魯棒準確的定位是機器人導航和自動駕駛車輛的重要組成部分,而利用相機在高精地圖(HD map)種進行定位則提供了一種低成本的定位傳感器,現有的方法大多由于容易出錯的數據關聯性或初始姿勢要求準確性而導致位姿估計失敗。在本文中,我們提出了一種經濟高效的車輛定位系統,該系統使用相機作為主要傳感器,在具有高精地圖環境中用于自動駕駛,為此,我們將基于視覺的定位描述為一個數據關聯問題,將視覺語義信息映射到高精地圖中的路標。
美團分布式自動駕駛引擎
經過數年的積累,美團無人車已經從技術探索進入到業務運營階段,這個階段對于自動駕駛車端系統和離線系統都有了新的要求。
08 / LiveVideoStack主編觀察:開源RTC的機會來了嗎?
還有讓RTC圈更卷的方法嗎?有啊,開源、免費走起。前幾天,連響在WebRTC群里分享了一個新項目Livekit,同時也是一家公司(https://livekit.io/)。
專訪 | Zoe Liu:早點兒創業不好么?
你有“創業夢”嗎?是否還在堅持?
北京時間9月28日晚20點,國內最大的音視頻社區LiveVideoStack就【創業】主題與微幀科技聯合創始人兼首席科學家Zoe Liu進行了一次深度對話,以下是對話內容,根據問題略有調整。
插圖源自Pexels
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 215的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 08 / LiveVideoStack主
- 下一篇: 【今晚9点】:对话刘连响——web流媒体