音视频技术开发周刊 | 216
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉僅支持公眾號相關鏈接
個性化語音識別模型,幫助語言障礙人士正常交流
語言障礙癥狀影響著數百萬人的生活,其產生原因很多,包括神經或遺傳疾病、身體缺陷、腦損傷或聽力喪失等,而由此導致的癥狀也各不相同,如口吃、構音障礙 (Dysarthria)、失用癥 (Apraxia) 等,這些癥狀對患者的自我表達、社會生活參與,以及使用語音技術,都會產生不利影響。
自動語音識別 (ASR, Automatic Speech Recognition) 技術可以通過提升設備的聽寫和家居自動化能力以及溝通能力,來幫助語言障礙人士克服上述問題。然而,盡管隨著深度學習系統計算能力的提升,以及有大型訓練數據集可供使用,ASR 系統在準確率方面有所提升,但是對于許多具有語言障礙的人而言,系統的性能仍有所欠缺,導致許多本應受益良多的患者無法有效利用這項技術。
時間二次采樣對體素視頻質量評估精度的影響
主要介紹了時間二次采樣對體素視頻質量評估精度的影響,從不同時間采樣率、不同時間池化方法角度分別進行了實驗探討。
元宇宙,到底是個什么宇宙?
本文將介紹元宇宙除游戲以外的其他應用場景,以及邁向元宇宙的過程中我們還需要哪些技術支持?
清華校友吳旻當選IEEE SPS首位華裔女主席,曾發明“數字水印”防偽技術
IEEE信號處理學會 (SPS)2022-2023候任主席公布了。馬里蘭大學教授、清華校友吳旻從候選者中脫穎而出,將在2024-2025成為學會70余年歷史上第一位華裔女主席!
低延遲廣播協議及其部署
這篇文章主要介紹了各種低延遲廣播場景下的傳輸協議性能和其部署。
視頻編碼完全指南
視頻編碼是一門在減少視頻數據體積大小或碼率的同時而不對其質量產生不良影響(在人類的視覺感知下)的科學。對視頻進行編碼從而減少其數據體積同時保持視頻質量是一項綜合了藝術和科學的技術。在本篇文章中,我們將介紹這個復雜且神奇的領域對視頻流和視頻傳輸產生的巨大影響。
PCS2021:VVC基于神經網絡改進SAO
本文來自PCS2021論文《Revisiting the Sample Adaptive Offset post-filter of VVC with Neural-Networks》。
在HEVC中就已經引入SAO來解決振鈴效應,VVC中的SAO和HEVC中的基本相同。論文通過神經網絡(NN)來改進SAO的性能,其中SAO的基本原理保持不變,但是原先SAO對重建像素的分類方法被替換為NN。通過NN的改進VVC上SAO在RA配置下BD-Rate增益為2.3%,并且和其他基于NN的方法相比復雜度很低。
向量將死,哈希是 AI 未來
人工智能是建立在向量算法的基礎上的,但最新的進展表明,對于某些 AI 應用程序而言,它們可以使用其他二進制來表示(例如神經哈希),以提供更小的內存占用和更快的反饋速度。
事實上,人工智能的許多領域都可以從向量變為基于哈希的結構,帶來飛躍的提升。本文將簡要介紹哈希背后的應用邏輯,以及它為什么可能會成為 AI 的未來。
人工智能音樂會替代音樂家嗎?
近日,外媒Science Focus采訪了倫敦瑪麗女王大學媒體與藝術技術中心主任尼克·布萊恩-金斯(Nick Bryan-Kinns)教授。請他解釋了人工智能音樂是如何創作的,為什么這項技術不會摧毀人類的創造力,以及機器人將如何很快成為現場表演的一部分。
圖靈獎得主楊立昆:AI+時代,未來將會如何被改變
圖靈獎得主、Facebook 人工智能首席科學家楊立昆(YannLeCun)在他的新書《科學之路:人,機器與未來》具體闡述了人工智能革命的起始極其對人類社會產生的影響。
基于塊的學習型圖像壓縮模型
本文來自PCS2021 SS3的第四場演講,介紹了一個基于塊的學習型圖像壓縮模型(BLIC),它包括一個邊界預測模塊,用于執行學習型的幀內預測以輔助目標塊的熵編碼。它使用卷積神經網絡在latent空間中產生幀內預測,并使用這種幀內預測來輔助目標塊的latent特征的熵編碼。在整個圖像被解碼后,一個后處理網絡被應用于去除塊效應和降噪。
使用 CNN 進行快速 VVC 幀內編碼
文中視頻主要介紹了一種使用 CNN 進行快速 VVC 圖片內編碼的新方法,該方法基于 RDT 成本的可以應用于圖像內分割決策。
汽車CAN總線數據幀分類及格式詳解
本文詳細介紹了CAN協議的報文傳輸過程。在這個報文傳輸過程中有:數據幀、遠程幀、錯誤幀、過載幀和幀間隔。
來自技術人的吶喊:回歸本心,遠離內卷
作為一個小公司的技術人,我想分享一下自己關于內卷這個話題的見解。下面請跟隨我的思路,一起來分析一下并找到破局之路。
插圖源自Pexels
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 216的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【视频编解码的新挑战与新机会】
- 下一篇: 09 / LiveVideoStack主