音视频技术开发周刊 84期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第84期內容,祝您閱讀愉快。
架構
手機K歌的人聲伴奏對齊優化實踐
人類大腦對聲音的響應速度和敏感程度非常高。K歌時對人聲音軌和伴奏音軌的時間對齊有很強的要求。唱吧資深研發總監 王國騰在LiveVideoStackCon2018大會的分享中詳細介紹了手機K歌在混音對齊方面存在的問題,解決方案以及值得探索的方向。LiveVideoStack對演講內容進行整理。
沃爾瑪計劃放棄視頻流媒體服務,轉而專注于Vudu
沃爾瑪曾希望通過流媒體視頻服務與亞馬遜(Amazon)、蘋果(Apple)等競爭,但據報道,沃爾瑪現在放棄了這些計劃,轉而專注于目前的VOD服務Vudu。
直播開發過程中關于直播技術的架構問題
在直播開發過程中,需要關注的點有很多。但是我們并不能把關注點只是放在客戶端如何去采集音頻數據,或者是客戶端的推拉流的相關內容,而是應該先了解一下直播技術的架構問題。這樣一來,對于直播技術的運轉流程理解起來也就更加容易了。
傳輸網絡
TCP的困境與解決方案
TCP協議是互聯網應用最廣泛的數據傳輸協議之一,在過去的40年中改變了世界,但也成為了新的技術瓶頸。Cascade Range Networks, Inc CTO/聯合創始人 范醒哲在LiveVideoStack線上交流分享中詳細解析了TCP面臨的困境與可行的解決方案。本文由LiveVideoStack整理而成。
基于愛奇藝HCDN視頻分發網絡的開放緩存
為通過Internet向海量用戶傳輸高清晰度、高碼率的視頻節目,愛奇藝融合CDN和P2P技術,開發出一套適合多終端的混合分發傳輸網絡——HCDN。本文來自愛奇藝高級技術總監庹虎在LiveVideoStackCon 2018大會中的演講,由LiveVideoStack整理而成。
Webex 如何在在線會議領域保持優勢?
在實時通訊的所有的細分領域中,在線會議領域的競爭尤為激烈。Webex如何在此領域中保持優勢?本文來自ZK Research創始人兼首席分析師 Zeus Kerravala,LiveVideoStack進行了翻譯。
音頻/視頻技術
Android音頻開發之MediaPlayer
Android 提供了常見的音頻、視頻的編碼、解碼機制。借助于多媒體類 MediaPlayer 的支持,開發人員可以很方便地在應用中播放音頻、視頻。只不過使用 MediaPlayer 播放視頻時,沒有提供圖像輸出界面。
音視頻技術:視頻質量評價方法簡介
視頻質量評估(VQA)一直是個很活躍的研究領域,原因其一是業內一直缺少一種統一且準確的評估標準,其二是影響視頻質量的因素過多,且包含很多主觀因素,難以客觀、定量地評價。經過這么多年的研究,已經誕生了非常多的視頻質量評估方法,本文將簡單地對它們進行分類及介紹。
Puffer:專注擁塞控制、帶寬預測和ABR
斯坦福大學研究小組發布了一項新的開源研究項目Puffer,該項目致力于通過人工智能改進互聯網傳輸與視頻流算法。點擊【閱讀原文】訪問Puffer官網。
基于音視頻通信RTC實現音視頻通話
音視頻通信RTC產品 由多平臺SDK + 安全可靠,穩定低延時的傳輸網絡構成,為用戶提供基礎通用的實時音視頻通信服務,用戶可以基于RTC快速搭建各種實時通信場景化產品,譬如在線音視頻會議,1對1通話等,本文主要介紹如何基于RTC實現音視頻通話。
淺談車載音響DSP功放
現在主流的車載音響系統都是用帶有DSP功能的功放,這是因為數字信號處理技術可以有效的解決聲音重放系統在汽車這個極端惡劣的聲學環境下遇到的種種問題。
編解碼
ffplay源碼分析4-音視頻同步
ffplay是FFmpeg工程自帶的簡單播放器,使用FFmpeg提供的解碼器和SDL庫進行視頻播放。本文基于FFmpeg工程4.1版本進行分析。
RTMP推流H264+AAC
本文主要講述如何使用開源的rtmp庫來搭建一個rtmp client,推送H264和AAC流到rtmp server。筆者基于兩套開源的項目進行了測試:rtmpdump以及srslibrtmp(這個是國人在rtmpdump基礎上優化改進擴展的rtmp項目)。
BlackBerry通過Velos Media獲得HEVC專利授權
Velos Media宣布,黑莓已經加入該平臺,并將通過Velos Media獲得HEVC專利的授權。
《Android FFmpeg 播放器開發梳理》第二章 音視解碼器和視頻解碼器實現
MediaDecoder基類主要封裝一些基本的數據,比如媒體流、媒體流索引、待解碼的數據包隊列以及獲取數據包隊列的內存大小、隊列緩沖的時長等數據。
基于NVIDIA TEGRA系列板卡的硬件解碼及視頻推流
以NVIDIA TX1為例硬解碼就是利用硬件芯片來解碼的,TX1有單獨的解碼模塊,NVDEC。
AI智能
基于FPGA的深度學習加速器綜述:挑戰與機遇
FPGA 的神經網絡加速器如今越來越受到 AI 社區的關注,本文對基于 FPGA 的深度學習加速器存在的機遇與挑戰進行了概述。
YouTube深度學習推薦系統的十大工程問題
文章主要介紹了YouTube深度學習系統論文中的十個工程問題,為了方便進行問題定位,我們還是簡單介紹一下背景知識,簡單回顧一下 Deep Neural Networks for YouTube Recommendations 中介紹的YouTube深度學習推薦系統的框架。
深度卷積神經網絡架構最新進展綜述
近幾年的AI發展潮流勢不可擋,其中深度學習算法功不可沒,巨大的應用價值也造就了這一領域的快速發展速度,相關論文層出不窮,今天為大家推薦一篇最新的綜述文章,介紹了深度卷積神經網絡(CNN)框架的一些最新研究進展。
圖像
Adobe放出P圖新研究:就算丟了半個頭,也能逼真復原
通用式三維即時成像技術
采用基于雙目視覺測量技術中的被動式純光學成像的技術,是最符合“機器眼”三維成像目標要求的技術。單純使用雙目匹配算法實現三維立體圖像計算,目前廣泛應用在航測領域,但該方法在計算三維時,需要人工干預,且大都采用后期處理的方式,難以采用一套程序自動完成。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 84期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: B站QUIC实践之路
- 下一篇: 开源声码器WORLD在语音合成中的应用