直播预告 | AAAI 2022论文解读:基于生成模型的语音/歌声合成与歌声美化
「AI Drive」是由 PaperWeekly 和 biendata 共同發起的學術直播間,旨在幫助更多的青年學者宣傳其最新科研成果。我們一直認為,單向地輸出知識并不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產生更大的價值。
本期 AI Drive,我們邀請到浙江大學計算機科學與技術學院碩士生劉靜林,為大家在線解讀其發表在 AAAI 2022?的最新研究成果:DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism。對本期主題感興趣的小伙伴,3?月 1?日(本周二)晚 7 點,我們準時相約 PaperWeekly 直播間。
直播信息
在對聲音頻譜的建模中,非周期性的參數影響著清音、呼吸聲以及濁音的自然度。但這種參數具有不確定性,簡單的損失函數很難進行較好的建模。最近兩年,生成式模型在聲音合成領域嶄露頭角,本次報告將圍繞生成式模型在聲音合成中的應用這一話題,介紹該領域的前沿研究。同時,本次報告還會重點介紹近日熱度驟增的歌聲合成任務,從現代歌聲合成的流水線,到現階段歌聲合成中的難點與瓶頸。最后,本次報告會介紹一類新興任務:歌聲美化。
論文標題:
DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism
論文鏈接:
https://arxiv.org/abs/2105.02446
代碼鏈接:
https://github.com/MoonInTheRiver/DiffSinger
本次分享的具體內容有:?
生成式模型建模聲音頻譜的前沿研究
歌聲合成任務
歌聲美化任務
嘉賓介紹
?劉靜林?/ 浙江大學碩士生?
劉靜林,浙江大學計算機科學與技術學院二年級研究生。2020 年于浙江大學竺可楨學院混合班(計算機科學與技術專業)本科畢業,保至本校攻讀碩士研究生。研究方向為自然語言處理,包含:語音&歌聲合成、機器翻譯、唇語識別&合成,專注于深度生成模型在自然語言處理中的應用。在 AAAI、ACL、NeurIPS 等國際人工智能頂級會議上發表論文 10 余篇。相關開源倉庫收到學術界與工業界的廣泛關注。
直播地址?& 交流群
本次直播將在 PaperWeekly 視頻號和 B 站直播間進行,掃描下方海報二維碼或點擊閱讀原文即可免費觀看。線上分享結束后,嘉賓還將在直播交流群內實時 QA,在 PaperWeekly 微信公眾號后臺回復「AI Drive」,即可獲取入群通道。
視頻號直播間:
掃描下方二維碼關注 PaperWeekly 視頻號,第一時間獲取開播提醒。
B 站直播間:
https://live.bilibili.com/14884511
合作伙伴
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·
總結
以上是生活随笔為你收集整理的直播预告 | AAAI 2022论文解读:基于生成模型的语音/歌声合成与歌声美化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 尼桑天籁适合用哪款半球火花塞?
- 下一篇: 公积金装修贷款注意事项