音视频技术开发周刊 | 144
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿:contribute@livevideostack.com。
架構(gòu)
花椒敏感詞系統(tǒng)架構(gòu)詳細(xì)
直播系統(tǒng)主要是以內(nèi)容為主,好的內(nèi)容可以吸引用戶來欣賞,也能為公司帶來可觀的收益,既然有傳播的入口,那么必然有負(fù)面內(nèi)容的出現(xiàn),隨著平臺(tái)用戶量不斷擴(kuò)大,內(nèi)容的監(jiān)管也是必不可少的一個(gè)環(huán)節(jié),比如國家監(jiān)管部門要求攔截詞語包括涉政、非法、宗教、暴恐、版權(quán)等,以及平臺(tái)自身需要攔截的詞語包括競品挖人、低俗、廣告等垃圾詞,那么我們本章就從文本內(nèi)容的管控角度介紹下花椒敏感詞服務(wù)的定制和應(yīng)用。
https://mp.weixin.qq.com/s/GXVlcyGd9WsPGw0oSGmxgw
使用 serverless 技術(shù)構(gòu)建 Raspberry Pi 遠(yuǎn)傳機(jī)器人
如何使用 AWS Kinesis 視頻流與 WebRTC 。第一個(gè)關(guān)于這個(gè)技術(shù)話題的帖子。
https://idk.dev/building-a-raspberry-pi-telepresence-robot-using-serverless-part-2/
傳輸網(wǎng)絡(luò)
廣播的新概念:SRT——遠(yuǎn)程家庭工作流程的簡單解決方案
本視頻演講來自Haivision SRT Tuesday Webinar系列,由Haivision產(chǎn)品營銷副總裁Marcus Schioler、技術(shù)銷售Selwyn Jansl和Live X的制片人兼聯(lián)合創(chuàng)始人Corey Behnke共同完成。演講的主題是“SRT——遠(yuǎn)程家庭工作流程的簡單解決方案”。
https://mp.weixin.qq.com/s/9mVvq2vHRxS6ALNPQyTOGw
QUIC能否代替TCP/IP
本文是來自SNIA on Networking Storage的演講,演講者是Tim Lustig和Lars Eggert,前者是Mellanox Technologies企業(yè)以太網(wǎng)營銷總監(jiān),后者是NetApp網(wǎng)絡(luò)技術(shù)總監(jiān)。演講主題是QUIC能否代替TCP/IP。
https://mp.weixin.qq.com/s/eivw3r67_XNjFCzmKQIh3g
低延遲直播流技術(shù)
本文來自Bitmovin NAB 2020 Tech Talk,演講者是來自Bitmovin的軟件工程師Jameson Steiner,演講的主題是低延遲直播流技術(shù)。
https://mp.weixin.qq.com/s/UMthlPancMBLFfrGlqYZsg
RIST和開放廣播系統(tǒng)
RIST是一種流協(xié)議,它允許諸如互聯(lián)網(wǎng)之類的有損網(wǎng)絡(luò)用于關(guān)鍵的流應(yīng)用。它稱為可靠的Internet流傳輸,它使用ARQ(自適應(yīng)重復(fù)請求)重傳技術(shù)來請求網(wǎng)絡(luò)丟失的任何數(shù)據(jù),從而為視頻分發(fā)創(chuàng)建可靠的路徑。
https://mp.weixin.qq.com/s/RZJF8nqYFXfl6I9-l4k4zw
視頻技術(shù)
Firefox中帶有AudioWorklet的高性能Web音頻
AudioWorklet于2018年首次引入網(wǎng)絡(luò)。從那以后,Mozilla一直在研究如何在WebAudio API中“不妥協(xié)”地實(shí)現(xiàn)這個(gè)特性。本周,Firefox 76發(fā)布了音頻工作包。我們已經(jīng)準(zhǔn)備好開始彌合原生應(yīng)用程序中的音頻功能與web上的可用功能之間的差距。
https://hacks.mozilla.org/2020/05/high-performance-web-audio-with-audioworklet-in-firefox/
視頻圖像處理中的錯(cuò)幀同步是怎么實(shí)現(xiàn)的?
錯(cuò)幀同步,簡單來說就是把當(dāng)前的幾幀緩沖到子線程中處理,主線程直接返回子線程之前的處理結(jié)果,屬于典型的以空間換時(shí)間策略。
https://mp.weixin.qq.com/s/h0QWgAOX_a6tXGi871BMXA
構(gòu)建音視頻直播應(yīng)用需要考慮的12件事(翻譯)
打造一個(gè)流媒體平臺(tái)除了像一般后端服務(wù)要求那樣,比如性能、擴(kuò)展性、可維護(hù)性以及可測試性,還有其它音視頻技術(shù)方面的考慮。
https://mp.weixin.qq.com/s/HabAKIpW0ARM57ShSyh-SQ
構(gòu)建iOS Live Streaming App時(shí)要考慮的11件事
構(gòu)建iOS實(shí)時(shí)流應(yīng)用程序可能很繁瑣。在任何Web應(yīng)用程序所需的所有后端系統(tǒng)基礎(chǔ)結(jié)構(gòu)之上,還有本機(jī)應(yīng)用程序集成的其他注意事項(xiàng)。因此,一些實(shí)時(shí)流軟件公司提供了移動(dòng)SDK,以幫助簡化此過程。
https://www.red5pro.com/blog/11-things-to-consider-when-building-an-ios-live-streaming-app/
視頻通話的發(fā)展方向是什么?
Google Meet 與 Zero 競爭
https://www.nojitter.com/unified-communications-collaboration/google-meet-race-zero
如何在網(wǎng)絡(luò)視頻聊天中添加覆蓋層 overlay
收藏起來,以便日后使用。
https://www.twilio.com/blog/add-an-overlay-to-web-video-chat
人物專訪
云游戲之大冒險(xiǎn):5G,等還是不等 | 專訪云格致力陳浩
Global Market Insights預(yù)測全球云游戲市場將從2018年的10億美元增長到2025年的80億美元,復(fù)合年增長率達(dá)到30%(不同的市場報(bào)告預(yù)測數(shù)據(jù)略有不同,但都肯定了云游戲市場迅速增長的趨勢)。
https://mp.weixin.qq.com/s/bcxwiOY0DuxOpZyvN3qYBQ
云游戲之真心話:一切才剛剛開始 | 對話南京大學(xué)副教授馬展
在此前的報(bào)道中,騰訊云高管也曾表示,騰訊將更多地依靠游戲內(nèi)廣告以及向游戲設(shè)計(jì)方出售數(shù)據(jù)等其他收入來源,而不會(huì)采用國外的訂閱制模式來獲利。騰訊當(dāng)然可以選擇這樣一條發(fā)展路徑,那么那些擁有有限IP的游戲制造商和小公司呢?
https://mp.weixin.qq.com/s/fHkfEwiPlb7dr-PNJCn7AA
端側(cè)AI:高隱私、高可靠的智能個(gè)性化服務(wù)
相較于云端AI需要用戶將數(shù)據(jù)發(fā)送到云端進(jìn)行處理,存在網(wǎng)絡(luò)穩(wěn)定性、隱私安全等問題。隨著終端算力的提升,端側(cè)AI本地處理數(shù)據(jù)的高隱私性以及對用戶使用習(xí)慣的智能感知,將為用戶帶來更可靠的個(gè)性化優(yōu)質(zhì)服務(wù)。
https://mp.weixin.qq.com/s/eqdLwaj_TSnBgB3In2Aj1Q
AI智能
深度學(xué)習(xí)落地移動(dòng)端
Q音探歌是QQ音樂孵化的一款全新APP,主打高效、準(zhǔn)確的“聽歌識(shí)曲”,“掃描識(shí)別MV”功能,這些服務(wù)的實(shí)現(xiàn)離不開深度學(xué)習(xí)能力。把深度學(xué)習(xí)推斷帶到邊緣設(shè)備( inference on the edge ),可以減少計(jì)算時(shí)間,改善用戶體驗(yàn),但是也面臨著種種挑戰(zhàn)。
https://mp.weixin.qq.com/s/vzDybxT20XDxDq-kWZhZuQ
CVPR 2020 Oral | 曠視研究院提出對抗攻擊新方法DaST:無需真實(shí)數(shù)據(jù)訓(xùn)練替身模型
曠視研究院提出一個(gè)無需數(shù)據(jù)訓(xùn)練替身模型實(shí)現(xiàn)黑盒對抗攻擊的方法,稱之為DaST(Data-free Substitute Training),它利用生成對抗網(wǎng)絡(luò)GAN生成合成樣本,以訓(xùn)練替身模型,而合成樣本的標(biāo)簽來自目標(biāo)模型。
https://mp.weixin.qq.com/s/wLctKCYHgNqHKXQgLIBKfA
AI修復(fù)100年前晚清影像喜提熱搜,這兩大算法立功了
為了實(shí)現(xiàn)高清修復(fù),Shiryaev 使用了兩種神經(jīng)網(wǎng)絡(luò):Google 的 DAIN(深度感知視頻幀插值,Depth-Aware Video Frame Interpolation)和 Topaz Labs的 Gigapixel AI。其中,Gigapixel AI 用于將微弱分辨率的視頻一直擴(kuò)展到 4K,而 DAIN 用于創(chuàng)建和插入之前不存在的幀,從而將視頻的 FPS 增加到 60。
https://mp.weixin.qq.com/s/KE69qTH2ft9rltAGIk_dbA
圖像
摳圖專家要失業(yè)了?CV技術(shù)加持下的AR,實(shí)現(xiàn)隔空摳圖復(fù)制粘貼
利用這個(gè)技術(shù)只用一部手機(jī)就能將書上的圖片直接復(fù)制到電腦上,全程用不到10秒鐘。
https://www.leiphone.com/news/202005/uZrdIAgE0kMhcsgB.html
資源推薦
插幀算法 DAIN
我們提出了深度感知視頻幀插值(DAIN)模型,通過挖掘深度線索來顯式地檢測遮擋。我們開發(fā)了一個(gè)深度感知的流投影層來合成中間流,該中間流最好是對距離較近的對象進(jìn)行采樣,而不是對距離較遠(yuǎn)的對象進(jìn)行采樣。我們的方法在Middlebury數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的性能。
https://github.com/baowenbo/DAIN
點(diǎn)擊“閱讀原文”可查看更多詳細(xì)信息,請大家科學(xué)上網(wǎng)。
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 144的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSU发布2020年度4K编码效率评测结
- 下一篇: 风起云涌时,亦是光芒四射时 | Live