【声入人心:音频新体验】
在過去的一年中,我們可以看到多媒體特別是音視頻技術的能力在嚴峻的挑戰(zhàn)下,為各行各業(yè)帶來了巨大的變化。疫情過后,又會有哪些多媒體新技術、新實踐呈現(xiàn)在大眾的視野當中?為行業(yè)的發(fā)展與應用帶來哪些新的趨勢與機會?
10月29日-30日,LiveVideoStackCon 2021 音視頻技術大會?北京站,一同探討視頻行業(yè)與技術發(fā)展的挑戰(zhàn)與更多機會。
文末福利:往屆(部分)精彩演講視頻及內(nèi)容整理
.聲入人心:音頻新體驗.
從K歌、游戲、電影到音樂教學,更好的聲音表現(xiàn)力將給用戶體驗帶來質的提升。本專題將討論最新的音頻方案,涉及全景聲、語音合成、語音識別、回聲消除等。
.講師與議題.
SPEAKER
of 2021
喬寧博?/?
騰訊專家研究員
微信通話音頻技術負責人
2011年畢業(yè)于四川大學,從事音頻實用技術研發(fā)十余年。加入騰訊后主導了微信等產(chǎn)品的音頻技術研發(fā),目前主要負責微信音頻通話、語音消息、短視頻等各類音頻相關業(yè)務的技術研發(fā)和團隊管理,擁有豐富的音頻技術研究與互聯(lián)網(wǎng)產(chǎn)品業(yè)務實踐經(jīng)驗。團隊研發(fā)的音頻技術,除應用于微信通話外,在游戲語音通話中也有廣泛應用。?
TOPIC:
.微信億級通話的音頻技術優(yōu)化之路.
微信通話系統(tǒng)的語音質量提升歷程分享。從信源和信道質量保障上,本次演講將詳細介紹打造高品質語音通話的關鍵路徑,為億級用戶提供優(yōu)質通話服務。講解端到端各節(jié)點可能遇到的問題,以及相應解決方案。
SPEAKER
of 2021
沈俊聰/?
荔枝??音頻技術負責人
2010年7月到2013年3月,在華為擔任音頻算法工程師,負責華為手機的語音增強等模塊。2013年4月到現(xiàn)在,在荔枝擔任音頻技術負責人,先后帶領團隊完成了幾個重要項目:手機端音頻節(jié)目錄制工具,讓用戶低門檻錄制高音質音頻節(jié)目;高音質音頻直播引擎,讓用戶很容易就能在手機上進行高清語音直播;AI聲音理解后臺,能對不同聲音事件進行快速分類;
TOPIC:
.荔枝語音直播中的高音質技術實踐.
荔枝在語音直播中,用到了多種音頻處理技術,譬如結合場景檢測的智能降噪技術,能大大提升音樂等場景音質;自研的回聲抑制技術,雙講性能得到很大提升。智能語音加減速技術,讓延時較低的情況下保持聲音自然清晰;在線機型匹配等技術,讓機型適配更高效。
SPEAKER
of 2021
高月潔/?
網(wǎng)易云音樂??
高級音頻算法工程師
主要研究領域為歌唱評價與嗓音分析。負責音街(網(wǎng)易云旗下K歌app)的綜合評分系統(tǒng)設計與算法研發(fā),參與音街歌手能力圖譜項目,參與Look直播、云音樂嗓音相關算法研發(fā)。
TOPIC:
.K歌中的歌唱評價與嗓音分析.
音樂專家在評價歌唱行為時,可通過生理機能與演唱完成度兩個層面對演唱者進行分析。傳統(tǒng)的歌唱評價算法只對音準進行打分,維度較為片面。作為國內(nèi)首創(chuàng)的綜合評分功能,音街的綜合評分系統(tǒng)可對用戶的音準、節(jié)奏、氣息、顫音、滑音、情感等維度進行綜合評價,這些多維度評分在增加演唱趣味性的同時,也可為作品分發(fā)提供可用的標簽。同時,對用戶嗓音、演唱行為進行綜合分析,可建立歌手能力圖譜,依據(jù)用戶嗓音條件,為他推薦適合演唱的歌曲。本次分享將圍繞歌唱與嗓音分析,介紹相關的體系與算法實現(xiàn)。
SPEAKER
of 2021
張俊博/?
小米? 語音技術專家
博士畢業(yè)于中國科學院聲學研究所,多年從事智能語音技術的研究和應用,在語音識別、發(fā)音評測、語音合成等領域都做過深入的工作,在頂級會議和期刊發(fā)表論文10余篇。目前在小米負責若干項語音新技術的研發(fā)。
TOPIC:
.聲音成分的檢測與分離.
本次演講將詳細介紹語音技術中聲音成分檢測與分離的應用與實踐。
點擊閱讀原文了解更多大會相關信息,
獲取往屆(部分)精彩演講視頻及內(nèi)容整理
總結
以上是生活随笔為你收集整理的【声入人心:音频新体验】的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 07 / LiveVideoStack主
- 下一篇: VVC为什么首先在印度落地?