音视频技术开发周刊 | 134
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿:contribute@livevideostack.com。
架構(gòu)
Peer5與其他ECDN技術(shù)
如今,公司依靠基于云的視頻平臺將內(nèi)容流傳輸給員工。不幸的是,無論云基礎(chǔ)架構(gòu)有多強大,流質(zhì)量和并發(fā)收視率都受到辦公室ISP連接能力的限制,而在大型視頻事件中,辦公室ISP連接的能力很快就會飽和。當所有員工同時開始觀看視頻時,根本沒有足夠的帶寬來使用。
https://blog.peer5.com/peer5-vs-other-ecdn-technologies/
這就是 Intermedia 尋求 testRTC 主動監(jiān)控其 AnyMeeting 網(wǎng)絡(luò)會議服務(wù)的原因
中間媒體使用 testRTC 監(jiān)視其 AnyMeeting 服務(wù)。
https://testrtc.com/intermedia-testimonial/
Android基于RTMP視頻流的人臉識別(上篇)
相信大家都對直播不會陌生,直播的技術(shù)也越來越成熟了,目前有這樣的一個技術(shù),當彈幕飄到主播的臉上的時候,彈幕會自動消失,出了人臉范圍內(nèi),就繼續(xù)顯示出來。這個原理非常的簡單,其實就是人臉識別,將人臉識別范圍內(nèi)的彈幕全都隱藏。
https://juejin.im/post/5e55fe08f265da576d60a5d9
Android基于RTMP視頻流的人臉識別(下篇)
在上篇中我們已經(jīng)通過FFmpeg將Rtmp流成功的解析為NV21數(shù)據(jù),接下來筆者將講述如何通過OpenGL將NV21繪制上去,以及如何通過NV21進行人臉識別,并繪制人臉框。
https://juejin.im/post/5e5cc8c36fb9a07c9a1963ab
現(xiàn)代架構(gòu)中的VoIP
本篇是來自FOSDEM2020 Real Time Communications devroom的演講,演講者是來自nexmo的Giacomo Vacca,在VoIP領(lǐng)域已經(jīng)研究多年。演講主題是在云服務(wù)時代下設(shè)計和應(yīng)用VoIP架構(gòu)。
https://mp.weixin.qq.com/s/qbKQoC71GsU2RncP6NyXTQ
傳輸網(wǎng)絡(luò)
視頻會議場景下的弱網(wǎng)優(yōu)化
疫情將遠程辦公,視頻會議推上了風口的同時,同樣也為視頻會議平臺的運作帶來了更多的挑戰(zhàn)。藍貓微會創(chuàng)始人兼CEO 鄧昀澤在LiveVideoStack線上分享中針對視頻會議系統(tǒng)優(yōu)化中弱網(wǎng)定義,算法評估及技術(shù)實現(xiàn)等細節(jié)進行了詳細解析。
https://mp.weixin.qq.com/s/zCVi2Q6BAZTtzMIeytD8XA
RTSP流仍然重要的4個原因
實時流協(xié)議(RTSP)是一種設(shè)計用于網(wǎng)絡(luò)控制的協(xié)議。在日新月異的技術(shù)世界中,RTSP如何生存下來?這篇文章提出了四個原因。
https://www.red5pro.com/blog/4-reasons-rtsp-streaming-is-still-relevant/
TCP/IP的誕生
簡單總結(jié)了從TCP第一個版本的提出到最終為大家所熟知的TCP/IP協(xié)議族的產(chǎn)生的過程。
https://juejin.im/post/5e5bbc93f265da57553de2ce
HEP與RTC監(jiān)控軟件Homer
本文來自FOSDEM 2020 Real Time的演講,演講者是qixp的聯(lián)合創(chuàng)始人Lorenzo Mangani,演講主要介紹了開源軟件Homer以及它在2020年的更新。
https://mp.weixin.qq.com/s/SehtrOJNo4F2bdMfSgVTYg
編解碼
MPEG發(fā)展史
本文概述了MPEG的32年歷史。然而,我并不是想僅僅紀念32年的艱苦奮斗和偉大標準的產(chǎn)生,其目的是分析多年來MPEG組織如何演變以適應(yīng)標準化的需要。具體的人員在組織中起到了重要作用,但我們顯然不可能提及成千上萬制定了MPEG標準的專家,但是我有責任記錄下那些真正推動了MPEG標準開發(fā)的核心人員的名字。
https://mp.weixin.qq.com/s/Stf1arHRJVgff15Heg8FvQ
VVC視頻編碼標準化過程即將完成
2020年VVC視頻編碼進入標準化最后階段,有望在年底正式成為國際標準。
https://mp.weixin.qq.com/s/DdVwC9BcvGQ729n4VNOtJQ
視頻技術(shù)
通過WebRTC數(shù)據(jù)通道進行私人住宅監(jiān)視
當大多數(shù)人想到WebRTC時,他們就會想到視頻通信。同樣,家庭監(jiān)視通常與視頻流相關(guān)聯(lián)。這就是為什么我驚訝地聽到一個家庭安全項目的原因,該項目不是將WebRTC用于視頻流,而是將DataChannel用于WebRTC。WebRTC的DataChannel可能不像視頻通話那樣演示,但是如您所見,這是設(shè)置對等信息傳輸?shù)囊环N非常方便的方法。
https://webrtchacks.com/private-home-surveillance-with-the-webrtc-datachannel/
VoIP故障排除和監(jiān)視
本文來自FOSDEM 2020 Real Time的演講,演講者是SIP3的CTO兼聯(lián)合創(chuàng)始人的Oleg Agafonov,演講主題是基于IP的語音傳輸(VoIP)故障排除和監(jiān)視的常見問題解答。
https://mp.weixin.qq.com/s/kyXKq3W9Q29bV4oM30qrjA
多數(shù)消費者無法分辨8K與4K的區(qū)別
華納兄弟最近與皮克斯、Amazon Prime Video、LG和American Society of Cinematographers (ASC)合作,精心設(shè)計了一個雙盲研究以觀察人們是否能通過各種內(nèi)容辨別4K和8K之間的差異。
https://mp.weixin.qq.com/s/ZUy_Vg4cRm-uDsnnvVB7-A
聊五分鐘未來——視頻會議音頻技術(shù)的下半場
本次我們請到了中國國家科技部科學(xué)技術(shù)專家楊棟,聊了聊他心中視頻會議未來的技術(shù)發(fā)展趨勢。
https://mp.weixin.qq.com/s/9mWNe8KcZz9J7_hSyEH-ww
人物專訪
李郁韜:短期爆發(fā)還是未來趨勢?騰訊云海量音視頻通信服務(wù)背后的技術(shù)發(fā)展
面臨特殊時期,無論遠程辦公、還是學(xué)校“停課不停學(xué)”都成為時下的必然選擇,眾多視頻會議平臺也在特殊環(huán)境下開啟了短期免費開放及功能服務(wù)。但與此同時不可避免會帶來突發(fā)的大規(guī)模在線視頻與協(xié)作需求與流量沖擊,面對高并發(fā)、高可用、高性能的挑戰(zhàn),平臺背后技術(shù)如何支持?未來趨勢會在哪里?我們邀請到騰訊云視頻通信業(yè)務(wù)總經(jīng)理李郁韜分享騰訊云在編解碼、視頻網(wǎng)絡(luò)傳輸?shù)确矫婕夹g(shù)優(yōu)化。
https://mp.weixin.qq.com/s/h4mc4DtwIraS57kW8Vd3Ew
AI智能
實戰(zhàn)級Stand-Alone Self-Attention in CV,快加入到你的trick包吧 | NeurIPS 2019
論文提出stand-alone self-attention layer,并且構(gòu)建了full attention model,驗證了content-based的相互關(guān)系能夠作為視覺模型特征提取的主要基底。在圖像分類和目標檢測實驗中,相對于傳統(tǒng)的卷積模型,在準確率差不多的情況下,能夠大幅減少參數(shù)量和計算量,論文的工作有很大的參考意義。
https://juejin.im/post/5e5c6cbd518825492442d122
深度學(xué)習(xí)圖像算法在內(nèi)容安全領(lǐng)域的應(yīng)用
互聯(lián)網(wǎng)給人們生活帶來便利的同時也隱含了大量不良信息,防范互聯(lián)網(wǎng)平臺有害內(nèi)容傳播引起了多方面的高度關(guān)注。本次演講從技術(shù)層面分享網(wǎng)易易盾在內(nèi)容安全領(lǐng)域的算法實踐經(jīng)驗,包括深度學(xué)習(xí)圖像算法在復(fù)雜場景下的效果優(yōu)化方案。
https://mp.weixin.qq.com/s/zrQWuTRKBn2Sg9RUNc0u8Q
圖像
使用紋理映射技術(shù)借助于 OpenGL 的圖像雙線性插值算法可以輕易實現(xiàn)圖像的伸縮效果
在 OpenGL 中,紋理實際上是一個可以被采樣的復(fù)雜數(shù)據(jù)集合,是 GPU 使用的圖像數(shù)據(jù)結(jié)構(gòu),紋理分為 2D 紋理、 立方圖紋理和 3D 紋理。2D 紋理是 OpenGLES 中最常用和最常見的紋理形式,是一個圖像數(shù)據(jù)的二維數(shù)組。紋理中的一個單獨數(shù)據(jù)元素稱為紋素或紋理像素。
https://juejin.im/post/5e5b7e40e51d4526e26286a8
資源推薦
今日 Paper | 動態(tài)圖像檢索;實時場景文本定位;感知場景表示;雙重網(wǎng)絡(luò)等
目錄:Sketch Less for More:基于細粒度草圖的動態(tài)圖像檢索
ABCNet:基于自適應(yīng)Bezier-Curve網(wǎng)絡(luò)的實時場景文本定位
通過逐步增加蒙版區(qū)域來修復(fù)圖像
BlockGAN:從未標記的圖像中學(xué)習(xí)3D對象感知場景表示
用于行人重識別的交叉分辨對抗性雙重網(wǎng)絡(luò)
https://www.leiphone.com/news/202003/YjR4EdBvfo4c8oh1.html
OWT開發(fā)環(huán)境搭建
OWT開發(fā)環(huán)境搭建,本機快速部署,不用改IP。
https://github.com/winlinvip/owt-docker#usage-hostip
點擊“閱讀原文”可查看更多詳細信息,請大家科學(xué)上網(wǎng)。
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 134的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 范醒哲:敬畏自然 渴望技术 —— 新冠
- 下一篇: 视频会议未来趋势不完全预测