音视频技术开发周刊 77期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第77期內容,祝您閱讀愉快。
架構
基于FFmpeg的運動視頻分析
本文來自英特爾資深軟件工程師李忠,張華在LiveVideoStackCon 2018大會上的分享,由LiveVideoStack整理而成。分享中兩位老師重點介紹了基于FFmpeg的運動視頻分析技術架構,以及英特爾視頻分析的軟硬件解決方案。
RTMP之后,SRT與QUIC
RTMP協議存在累計延遲與加密方面的問題,為適應互聯網視頻低延時,高質量的要求,以UDP為核心,具有創造性的SRT,QUIC等流媒體視頻方式將成為新的選擇。本文來自NGCodec官方博客,由LiveVideoStack進行摘譯。
AWS Elemental推出新一代基于云的直播視頻服務
亞馬遜的AWS Elemental新推出了一種可靠,安全且靈活的實時視頻傳輸服務MediaConnect,其主要功能包括視頻源的獲取,分發與共享。
一切從用戶的需求與體驗出發
2018年音視頻生態發生了許多變化,從視頻編碼到網絡傳輸,5G的標準完善、QUIC的更名確認、人工智能的不斷升溫,他們對多媒體技術將產生怎樣的影響,未來技術發展方向又將如何?LiveVideoStack邀請了三體云系統架構師時杰、即構科技資深架構師祝永堅和七牛直播云流媒體負責人謝然探討網絡傳輸、QoE以及2019年技術展望。
SDP協議總結
SDP(Session Description Portocol)會話描述協議,通常通過內容類型為"application/sdp"的MIME來表示。
流媒體協議RTSP、HTTP、HTTPS、SDP四種區別解析
了解了基本協議,我們在看代碼寫代碼的過程中,就會有事半功倍的效果。下面主要講解RTSP,HTTP,HTTPS, SDP四種協議,一起來看看了解下,僅供參考。
播放器技術分享(1):架構設計
第一期文章要推出的內容主要涉及到播放器比較核心的幾個技術點,本篇是系列文章的第一篇,主要聊一聊播放器的架構設計。
播放器技術分享(2):緩沖區管理
第一期文章要推出的內容主要涉及到播放器比較核心的幾個技術點,本篇是系列文章的第二篇,主要聊一聊播放器的緩沖區管理。
音頻/視頻技術
VVC最新進展: 超高清和360全景視頻壓縮工具
近日(2018.11.23),RWTH Aachen University的Mathias Wien做了一個“Versatile Video Coding: Compression Tools for UHD and 360° Video”的講座。該講座概述了ITU-T和ISO / IEC新興的通用視頻編碼標準(VVC)的主要編碼工具和功能。VVC解決了三類視頻:標準動態范圍視頻(SDR),高動態范圍視頻(HDR)和360°視頻。
OBS集成WebRTC
本文主要描述: - OBS的輸出插件開發; - 外部的YUV視頻數據怎么輸入WebRTC; - 外部的PCM音頻數據怎么輸入WebRTC; - 外部怎么實現WebRTC的編碼器; - 怎么封裝OBS的編碼器讓WebRTC可以使用X264和硬件編碼器。
HDR視頻生態圈追蹤
2017年時的HDR生態圈如圖1所示,截止目前,HDR視頻生態圈已經產生了巨大的變化。本文將更新舊有的HDR生態圈范圍,并更清晰地描述當前HDR視頻生態圈。本文譯自The HDR video ecosystem tracker,原作者為 Yoeri Geutskens,曾任飛利浦消費電子公司DVD錄像機產品規劃經理。
Android多聲道錄音研究
原生Android只支持2 channel的錄音。可是偏偏會有多mic的需求,比如說語音識別。目前已知TDM協議可以將多mic數據從kernel送到hal,從內核空間搬運到用戶空間中。可是原生AudioRecord接口是完全不支持多channel錄音數據的采集的,怎么修改,才能讓原生進行支持呢?
基于Mediasoup的多方通話研究(一)
脫穎而出Mediasoup,可以用小而美來形容她:支持目前主流的瀏覽器,chrome、Firefox、safari、Edge等等;支持UnifiedPlanSdp和PlanBSdp兩種方式;ORTC的api風格調用方式,避免了WebRTC的不足,使協議更簡潔...
編解碼
MPEG最近在忙啥?
MPEG主席Leonardo近日描述了MPEG未來幾個月或幾年的主要活動和準備交付的標準進展。本帖子內容翻譯自其博客文章: Life inside MPEG, (http://blog.chiariglione.org/life-inside-mpeg/)
MSU編碼器主觀評測新結果
近日,MSU的Graphics & Media Lab(Video Group) 發布了一種新的視頻主觀質量評價方法,針對14種編碼器,以編碼速度高于1fps的參數對5段全高清1080p序列進行編碼和測試。
Android使用MediaCodec編碼AAC
MediaCodec 是Android系統提供的硬件編碼器,它可以利用設備的硬件來完成編碼,從而提高編碼效率,并可以減輕CPU壓力降低電量的使用。
Netty 解碼器
Netty里的解碼通過抽象類ByteToMessageDecoder進行統一規劃。ByteToMessageDecoder繼承了ChannelInboundHandlerAdapter,解碼器也是一個ChannelHandler。
AI智能
NVIDIA想要用AI實時生成視頻,效果遠超想象
NVIDIA剛剛在NeurIPS大會上展示了一項新的人工智能應用,可以看作是一個駕駛模擬系統,特點是其中的視頻內容由AI生成,你可通過真實方向盤來控制視頻內的車輛。
基于手機系統的實時目標檢測
在具有有限計算能力和存儲器資源的移動設備上運行卷積神經網絡(CNN)模型的日益增長的需求促進了對有效模型設計的研究。近年來已經提出了許多有效的架構,例如:MobileNet,ShuffleNet和NASNet-A。
AI做不了“真”3D圖像?試試Google的新生成模型
近日,在 NeurIPS 2018 會議上接收的論文“ 視覺對象網絡:圖像生成與分離式的3D表示”中,麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)和 Google 的研究人員介紹了能創造出有逼真紋理和形狀的一個生成式 AI 系統。
從0到1:神經網絡實現圖像識別(上)
“神經網絡”是“機器學習”的利器之一,常用算法在TensorFlow、MXNet計算框架上,有很好的支持。為了更好的理解與使用這件利器,我們可以不借助計算框架,從零開始,一步步構建模型,實現學習算法,并在一個圖像識別數據集上,訓練這個模型,再驗證模型預測的準確率。
圖像
圖像識別的原理、過程、應用前景
圖像識別技術的過程分為信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策。簡單分析了圖像識別技術的引入、其技術原理以及模式識別等,之后介紹了神經網絡的圖像識別技術和非線性降維的圖像識別技術及圖像識別技術的應用。從中可以總結出圖像處理技術的應用廣泛,人類的生活將無法離開圖像識別技術,研究圖像識別技術具有重大意義。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 77期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Netflix数据库架构变革:缩放时间序
- 下一篇: 基于QoE的实时视频编码优化:低功耗,低