Instagram:如何提升音乐音频质量?
Instagram始終以高質量的體驗為目標開發和優化應用程序,而優化Instagram體驗的其中一種方式就是提高音頻質量。
文 / Chris Hsu
譯 / 蔣默邱澤
原文?
https://instagram-engineering.com/improving-instagrams-music-audio-quality-284e555102e9
Instagram在形成有意義的社區方面起著至關重要的作用,這是因為人們可以在Instagram上相互聯系彼此并分享對他們來說最感興趣的事情。為了幫助更好地促進這些聯系,我們始終以高質量的共享體驗為目標來開發和優化應用程序。這讓我們引以為豪:)優化Instagram體驗的其中一個方法就是提高音頻質量。
Instagram的音樂貼歌單給出流行音樂建議
什么是音頻質量?
音頻質量就是衡量我們提供給Instagram App的音頻與原始未經過壓縮的音頻的匹配程度,一般情況下Instagram提供壓縮后的音頻,可實現音樂、視頻的流暢播放,減少緩沖造成的停頓。
但是為了實現更流暢的播放,可能會帶來壓縮失真的后果。一些壓縮失真的例子:高頻聲音的清晰度降低、低音減弱以及產生噪音。這些共同的差異同時降低了聽眾感知的音頻質量。
提升音頻質量
Instagram的視頻系統可以訪問多種級別的音頻質量,而音頻編解碼器如何選擇采樣率和碼率會影響到音頻編碼的質量。
不同的音頻編碼器具有不同級別的(有損壓縮[1]),它們在不同類型的內容上表現不一。鑒于Instagram內容的規模和范圍,嚴格評估編碼器最適合的內容,并跟蹤音頻質量相關指標非常重要。但我們不可能將大量實驗工程實際應用于監測音頻質量指標,所以我們采用最簡單的解決方案:通過現有的參與度指標來證明Instagram的聽眾關心音頻質量,改變音頻編碼器并不是一項簡單的內容。因此我們決定將保留AAC編碼器作為我們改進音頻質量的實驗編碼器。
采樣率會影響我們的音頻編碼并可以正確表示頻率上限,奈奎斯特·香農采樣定理[2]說:”若是波形的采樣速度是最高頻率成分的兩倍,那么可以對帶狀有限連續信號進行采樣的并從樣本中完美重建。“Instagram使用行業標準44.1kHz采樣率,超過大多數人可以聽到的最大20kHz,所以我們會排除變化的采樣率變量。
碼率以千比特每秒(kbps)為單位測量音頻文件中線性變化。換句話來講更高的碼率意味著音頻編碼中更多數據和更少壓縮。這樣低壓縮可以保留原始文件中更多特性,同時具有更少的壓縮失真。當碼率太低時編碼器會剔除它認為不太重要的音頻細節。由于我們采用音頻編碼和采樣率不變,并且改變碼率很容易事情;所以實驗中我們變化了很多音頻碼率改進。
碼率實驗
在內部音頻質量改進之前,Instagram對視頻中音頻默認碼率為64kbps。手機的麥克風不會產生豐富的音頻信號,盡管碼率較低;但Instagram音頻壓縮對大多數內容表現還算不錯。隨著Instagram創作者發布錄音室的音頻內容時(例如錄制音樂),明顯64kbps達不到高質量音頻。
我們收到一些藝術家報告反饋稱Instagram音頻聽起來“爆裂”或者質量太次的某些歌曲。我們立即觀察測試Instagram到壓縮控件中現象;例如:音樂帖故事中一些小鼓、镲片以及聲音混響的壓縮音頻聽起來比原始錄音更生硬和空洞。
很遺憾我們不能單純的為所有內容增加碼率,由于總帶寬限制。如果我們在音頻和視頻之間分配帶寬,這只不過是一個零和游戲。高質量視頻的碼率非常高對于64kbps和128kbps的音頻之間的差異對回放內容影響可以忽略不計。但是在低帶寬情況下,我們一定會用低得多碼率提供視頻這種情況下回放內容體驗64kbps時候會產生很差的音樂感覺。
雖然我們可以提高音頻碼率,但我們必須平衡音頻質量和視頻質量之間的權衡。增加所有內容的碼率是特別危險的,因為我們知道大多數內容都有簡單的音頻,并且不會從音頻方面的權衡中獲益。在我們的實驗中,我們的目標是為正確的內容做出正確的質量權衡。
特定內容和社區質量的偏好
為了找到關于Instagram聽眾對音頻信號質量偏好的凡響,我們考慮了提高音頻質量的方法。從我們之前關于視覺質量的實驗中,我們知道體驗的質量是主觀的,并且是內容類型和社區類型所特有的。
音頻質量靈敏度取決于每個聽眾對音頻細節的關注以及播放器材的質量(例如默認音響設備或耳機)。我們擔心一些使用低端手機揚聲器的Instagram用戶可能不會關注一般的音頻質量。另一方面,音樂家們知道Instagram是一個他們可以創建音樂社區的平臺,所以我們懷疑很多Instagram的聽眾會對音樂的音頻質量很敏感。
我們更希望看到音頻質量與Instagram音樂內容參與度之間的相關性最強,因為Instagram的音樂內容的音頻范圍很廣,也很豐富。為了得到這個信號,我們對產品進行了有針對性的音頻質量改進測試,我們希望音頻質量對產品產生最大的影響:音樂貼故事。
來自Relient K音樂貼 播放歌曲Cat
音樂貼故事實驗
為了避免非音樂內容的稀釋,我們利用Instagram視頻和音樂編碼標簽系統來放大A/B測試中故事類型音頻編碼。控制組中所有的音頻編碼都使用默認的64kbps碼率。我們運行兩個測試組:一組編碼使用96kbps,另一組音頻使用128kbps碼率。
在實驗結果中,我們看到通過提高音樂貼紙故事的音頻質量,用戶的參與度明顯提高。128kbps測試組提供了最佳的結果。我們通過觀看時間(即觀看視頻所花費的時間)和查看百分比衡量視頻參與度(即觀看者看完視頻的百分比)。盡管在視覺質量和重新緩沖方面出現了倒退,但觀看時間和查看百分比都有所提高。
我們預計到視覺質量和緩存會讓體驗退化,因為我們將帶寬使用從視頻轉移到音頻部分。但是參與度指標超出了我們的預期。這些指標表明即便是播放性能下降,Instagram觀眾也還是愿意觀看完整音樂貼視頻故事,因為音頻質量更引人入勝。
未來的變化
Music Sticker Stories增加了音頻碼率只是為Instagram群體提供個性化視頻內容體驗的開始。為了幫助我們在音頻質量、視頻質量和流暢度之間做出正確平衡,我們正在考慮構建基于感知音頻ABR(即自適應碼率)和內容識別(即識別哪些視頻內容具有音樂元素)的未來計劃。
參考
[1] 有損壓縮 https://en.wikipedia.org/wiki/Lossy_compression
[2] 奈奎斯特·香農采樣定理
https://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem
LiveVideoStack? 招募
LiveVideoStack正在招募編輯/記者/運營,與全球頂尖多媒及技術專家和LiveVideoStack年輕的伙伴一起,推動多媒體技術生態發展。了解崗位信息請在BOSS直聘上搜索“LiveVideoStack”,或通過微信“Tony_Bao_”與主編包研交流。
點擊【閱讀原文】或掃描圖中二維碼,即刻了解更多大會講師及分享內容信息!
總結
以上是生活随笔為你收集整理的Instagram:如何提升音乐音频质量?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CDN调试—Debug Headers
- 下一篇: 孙学京:我的大学在编程,练琴,听摇滚乐和