當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

音视频技术开发周刊 | 134

發(fā)布時間：2024/4/11 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了音视频技术开发周刊 | 134 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

每周一期，縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿：contribute@livevideostack.com。

架構(gòu)

Peer5與其他ECDN技術(shù)

如今，公司依靠基于云的視頻平臺將內(nèi)容流傳輸給員工。不幸的是，無論云基礎(chǔ)架構(gòu)有多強大，流質(zhì)量和并發(fā)收視率都受到辦公室ISP連接能力的限制，而在大型視頻事件中，辦公室ISP連接的能力很快就會飽和。當所有員工同時開始觀看視頻時，根本沒有足夠的帶寬來使用。

https://blog.peer5.com/peer5-vs-other-ecdn-technologies/

這就是 Intermedia 尋求 testRTC 主動監(jiān)控其 AnyMeeting 網(wǎng)絡(luò)會議服務(wù)的原因

中間媒體使用 testRTC 監(jiān)視其 AnyMeeting 服務(wù)。

https://testrtc.com/intermedia-testimonial/

Android基于RTMP視頻流的人臉識別（上篇）

相信大家都對直播不會陌生，直播的技術(shù)也越來越成熟了，目前有這樣的一個技術(shù)，當彈幕飄到主播的臉上的時候，彈幕會自動消失，出了人臉范圍內(nèi)，就繼續(xù)顯示出來。這個原理非常的簡單，其實就是人臉識別，將人臉識別范圍內(nèi)的彈幕全都隱藏。

https://juejin.im/post/5e55fe08f265da576d60a5d9

Android基于RTMP視頻流的人臉識別（下篇）

在上篇中我們已經(jīng)通過FFmpeg將Rtmp流成功的解析為NV21數(shù)據(jù)，接下來筆者將講述如何通過OpenGL將NV21繪制上去，以及如何通過NV21進行人臉識別，并繪制人臉框。

https://juejin.im/post/5e5cc8c36fb9a07c9a1963ab

現(xiàn)代架構(gòu)中的VoIP

本篇是來自FOSDEM2020 Real Time Communications devroom的演講，演講者是來自nexmo的Giacomo Vacca，在VoIP領(lǐng)域已經(jīng)研究多年。演講主題是在云服務(wù)時代下設(shè)計和應(yīng)用VoIP架構(gòu)。

https://mp.weixin.qq.com/s/qbKQoC71GsU2RncP6NyXTQ

傳輸網(wǎng)絡(luò)

視頻會議場景下的弱網(wǎng)優(yōu)化

疫情將遠程辦公，視頻會議推上了風口的同時，同樣也為視頻會議平臺的運作帶來了更多的挑戰(zhàn)。藍貓微會創(chuàng)始人兼CEO 鄧昀澤在LiveVideoStack線上分享中針對視頻會議系統(tǒng)優(yōu)化中弱網(wǎng)定義，算法評估及技術(shù)實現(xiàn)等細節(jié)進行了詳細解析。

https://mp.weixin.qq.com/s/zCVi2Q6BAZTtzMIeytD8XA

RTSP流仍然重要的4個原因

實時流協(xié)議（RTSP）是一種設(shè)計用于網(wǎng)絡(luò)控制的協(xié)議。在日新月異的技術(shù)世界中，RTSP如何生存下來？這篇文章提出了四個原因。

https://www.red5pro.com/blog/4-reasons-rtsp-streaming-is-still-relevant/

TCP/IP的誕生

簡單總結(jié)了從TCP第一個版本的提出到最終為大家所熟知的TCP/IP協(xié)議族的產(chǎn)生的過程。

https://juejin.im/post/5e5bbc93f265da57553de2ce

HEP與RTC監(jiān)控軟件Homer

本文來自FOSDEM 2020 Real Time的演講，演講者是qixp的聯(lián)合創(chuàng)始人Lorenzo Mangani，演講主要介紹了開源軟件Homer以及它在2020年的更新。

https://mp.weixin.qq.com/s/SehtrOJNo4F2bdMfSgVTYg

編解碼

MPEG發(fā)展史

本文概述了MPEG的32年歷史。然而，我并不是想僅僅紀念32年的艱苦奮斗和偉大標準的產(chǎn)生，其目的是分析多年來MPEG組織如何演變以適應(yīng)標準化的需要。具體的人員在組織中起到了重要作用，但我們顯然不可能提及成千上萬制定了MPEG標準的專家，但是我有責任記錄下那些真正推動了MPEG標準開發(fā)的核心人員的名字。

https://mp.weixin.qq.com/s/Stf1arHRJVgff15Heg8FvQ

VVC視頻編碼標準化過程即將完成

2020年VVC視頻編碼進入標準化最后階段，有望在年底正式成為國際標準。

https://mp.weixin.qq.com/s/DdVwC9BcvGQ729n4VNOtJQ

視頻技術(shù)

通過WebRTC數(shù)據(jù)通道進行私人住宅監(jiān)視

當大多數(shù)人想到WebRTC時，他們就會想到視頻通信。同樣，家庭監(jiān)視通常與視頻流相關(guān)聯(lián)。這就是為什么我驚訝地聽到一個家庭安全項目的原因，該項目不是將WebRTC用于視頻流，而是將DataChannel用于WebRTC。WebRTC的DataChannel可能不像視頻通話那樣演示，但是如您所見，這是設(shè)置對等信息傳輸?shù)囊环N非常方便的方法。

https://webrtchacks.com/private-home-surveillance-with-the-webrtc-datachannel/

VoIP故障排除和監(jiān)視

本文來自FOSDEM 2020 Real Time的演講，演講者是SIP3的CTO兼聯(lián)合創(chuàng)始人的Oleg Agafonov，演講主題是基于IP的語音傳輸（VoIP）故障排除和監(jiān)視的常見問題解答。

https://mp.weixin.qq.com/s/kyXKq3W9Q29bV4oM30qrjA

多數(shù)消費者無法分辨8K與4K的區(qū)別

華納兄弟最近與皮克斯、Amazon Prime Video、LG和American Society of Cinematographers (ASC)合作，精心設(shè)計了一個雙盲研究以觀察人們是否能通過各種內(nèi)容辨別4K和8K之間的差異。

https://mp.weixin.qq.com/s/ZUy_Vg4cRm-uDsnnvVB7-A

聊五分鐘未來——視頻會議音頻技術(shù)的下半場

本次我們請到了中國國家科技部科學(xué)技術(shù)專家楊棟，聊了聊他心中視頻會議未來的技術(shù)發(fā)展趨勢。

https://mp.weixin.qq.com/s/9mWNe8KcZz9J7_hSyEH-ww

人物專訪

李郁韜：短期爆發(fā)還是未來趨勢？騰訊云海量音視頻通信服務(wù)背后的技術(shù)發(fā)展

面臨特殊時期，無論遠程辦公、還是學(xué)校“停課不停學(xué)”都成為時下的必然選擇，眾多視頻會議平臺也在特殊環(huán)境下開啟了短期免費開放及功能服務(wù)。但與此同時不可避免會帶來突發(fā)的大規(guī)模在線視頻與協(xié)作需求與流量沖擊，面對高并發(fā)、高可用、高性能的挑戰(zhàn)，平臺背后技術(shù)如何支持？未來趨勢會在哪里？我們邀請到騰訊云視頻通信業(yè)務(wù)總經(jīng)理李郁韜分享騰訊云在編解碼、視頻網(wǎng)絡(luò)傳輸?shù)确矫婕夹g(shù)優(yōu)化。

https://mp.weixin.qq.com/s/h4mc4DtwIraS57kW8Vd3Ew

AI智能

實戰(zhàn)級Stand-Alone Self-Attention in CV，快加入到你的trick包吧 | NeurIPS 2019

論文提出stand-alone self-attention layer，并且構(gòu)建了full attention model，驗證了content-based的相互關(guān)系能夠作為視覺模型特征提取的主要基底。在圖像分類和目標檢測實驗中，相對于傳統(tǒng)的卷積模型，在準確率差不多的情況下，能夠大幅減少參數(shù)量和計算量，論文的工作有很大的參考意義。

https://juejin.im/post/5e5c6cbd518825492442d122

深度學(xué)習(xí)圖像算法在內(nèi)容安全領(lǐng)域的應(yīng)用

互聯(lián)網(wǎng)給人們生活帶來便利的同時也隱含了大量不良信息，防范互聯(lián)網(wǎng)平臺有害內(nèi)容傳播引起了多方面的高度關(guān)注。本次演講從技術(shù)層面分享網(wǎng)易易盾在內(nèi)容安全領(lǐng)域的算法實踐經(jīng)驗，包括深度學(xué)習(xí)圖像算法在復(fù)雜場景下的效果優(yōu)化方案。

https://mp.weixin.qq.com/s/zrQWuTRKBn2Sg9RUNc0u8Q

圖像

使用紋理映射技術(shù)借助于 OpenGL 的圖像雙線性插值算法可以輕易實現(xiàn)圖像的伸縮效果

在 OpenGL 中，紋理實際上是一個可以被采樣的復(fù)雜數(shù)據(jù)集合，是 GPU 使用的圖像數(shù)據(jù)結(jié)構(gòu)，紋理分為 2D 紋理、立方圖紋理和 3D 紋理。2D 紋理是 OpenGLES 中最常用和最常見的紋理形式，是一個圖像數(shù)據(jù)的二維數(shù)組。紋理中的一個單獨數(shù)據(jù)元素稱為紋素或紋理像素。

https://juejin.im/post/5e5b7e40e51d4526e26286a8

資源推薦

今日 Paper | 動態(tài)圖像檢索；實時場景文本定位；感知場景表示；雙重網(wǎng)絡(luò)等

目錄：Sketch Less for More：基于細粒度草圖的動態(tài)圖像檢索

ABCNet：基于自適應(yīng)Bezier-Curve網(wǎng)絡(luò)的實時場景文本定位

通過逐步增加蒙版區(qū)域來修復(fù)圖像

BlockGAN：從未標記的圖像中學(xué)習(xí)3D對象感知場景表示

用于行人重識別的交叉分辨對抗性雙重網(wǎng)絡(luò)

https://www.leiphone.com/news/202003/YjR4EdBvfo4c8oh1.html

OWT開發(fā)環(huán)境搭建

OWT開發(fā)環(huán)境搭建，本機快速部署，不用改IP。

https://github.com/winlinvip/owt-docker#usage-hostip

點擊“閱讀原文”可查看更多詳細信息，請大家科學(xué)上網(wǎng)。

總結(jié)

以上是生活随笔為你收集整理的音视频技术开发周刊 | 134的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：范醒哲：敬畏自然渴望技术 —— 新冠
下一篇：视频会议未来趋势不完全预测

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

音视频技术开发周刊 | 134

總結(jié)