客观指标VS主观质量:拨开遮挡高清视频技术的迷雾
金山云將在LiveVideoStackCon 2020北京站發布金山云圖像視頻感知評價指標Kingsoft Cloud Perceptual Assessment(KPA),這也是金山云與香港城市大學王詩淇老師團隊共同研發的成果,希望以此幫助行業距離實現“讓視頻更加高清”的目標更進一步。
受訪講師
樊鴻飛,金山云高級研發總監,北京大學計算機科學與技術專業博士,負責視頻云的VR、視頻編碼、AI等技術線研發,近年來主要從事沉浸式視頻、視頻編碼、圖像處理、計算機視覺方向上的研究與技術落地,主要研究與應用成果發表于國際頂級期刊IEEE TIP、IEEE TCSVT、IEEE TMM等。
以下內容由LiveVideoStack與樊鴻飛的采訪整理而成。
Q
金山云為何會推出KPA,與其他指標相比有何優勢?
樊鴻飛:目前能夠達到商用級的評價指標非常少,學術界的評價指標主要都是針對有非常明確邊界條件約束的場景。商用級的評價指標目前除了PSNR和SSIM之外,就是Netflix提出的VMAF了。
KPA與VMAF的區別在于,一方面VMAF是全參考的IQA/VQA指標,而KPA是一組無參考的IQA/VQA指標,因此KPA也可以應用在全參考來計算DMOS,同時KPA除了通用的整體質量評價外,還包括子維度質量、局部質量等細分評價指標,應用范圍更廣泛;另一方面,VMAF針對高清PGC視頻有比較強的能力,而KPA主要針對UGC視頻。
Q
在優化(衡量畫質的)評價指標的精確度方面,金山云有哪些針對性措施,成效如何(具體數據)?
樊鴻飛:針對現有評價指標算法(尤其是無參考評價算法)精度較低的問題,金山云KPA主要從兩個方向進行了重點研究和優化:一個是數據篩選,另一個是模型攻防。
在數據層面,通過收集各種場景下UGC及PGC視頻,并保證至少50以上的專業評測人員對每個視頻進行主觀評測,從源頭上避免數據主觀評測波動和精度問題。
同時,對收集到的數據,從內容、場景、質量等多個維度進行平衡篩選,在確保數據規模遠超業界開源數據的基礎上,提升數據的多樣性。
在模型層面,通過攻防設計、協同學習、困難樣本挖掘等方法,提升模型的魯棒性和精度,在開源數據上均取得10個點以上的增益,并在UGC場景中SROCC和gMAD分數均超越業界最好的有參考算法VMAF。
Q
金山云的KPA計算服務是如何避免或減少畫質折損的,以及KPA屬于主觀評測指標嗎?
樊鴻飛:KPA的全稱是Kingsoft Cloud Perceptual Assessment,主要是希望用客觀指標來衡量人眼的主觀感受。金山云KPA可以有效應用于編碼及AI方向,避免或減少畫質損失,提升視頻或圖像主觀質量.
在編碼方向,通過KPA對視頻進行場景級、幀級等全局質量預測分析,塊級局部質量預測分析,結合JND模型作為其最小可察覺主觀失真衡量,并由此自動決策出編碼所需要的CRF、QP等參數,能更好地匹配人類視覺主觀系統,消除視覺感知冗余,在保證主觀質量相同的情況下降低碼率或者在相同碼率下提升主觀質量;
在AI增強方向,通過將KPA的全局/局部/子維度評價作為不同側重點的loss或者判別器加入到模型訓練中,指導模型朝更好的畫質方向進行優化,進一步提升主觀畫質。
Q
金山云給出的畫質評測方案的主要應用場景是什么,亮點有哪些?
樊鴻飛:金山云通過魔鏡平臺來提供高效易用的圖像/視頻評測服務,不僅提升評測效率,也保證評測的準確性和科學性。整個方案包括數據篩選、評測維度制定、評測質量保證以及評測結果分析。
與此同時,金山云魔鏡平臺目前還提供了多個開源的客觀指標評測。金山云魔鏡平臺主要可以用于三種應用場景:內部算法迭代、用戶實際觀看體驗評估和競品分析對比。
Q
金山云KPA對于畫質評測行業而言有何價值?
樊鴻飛:在畫質評測行業,用客觀指標來衡量主觀質量一直以來都是一個世界難題。比如一個視頻在不同的設備上,不同的觀測距離中,都有不同的觀看感受。此外,除了整體分數以外,還有各個子維度的分數,比如色彩、亮度、清晰度、畸變等等。另外還涉及到網絡卡頓問題、VR視頻等等,問題非常復雜。
金山云KPA并不是用一個算法來解決所有的事情,目前發布的KPA主要針對于UGC視頻,對于播放場景的映射也是針對于常用場景,同時我們也在探索包括子維度評價、局部評價、評價映射等等主觀評價的各細分業務場景指標。
一方面,我們希望KPA能夠拋磚引玉,吸引更多學術界的學者來關注企業應用中真正的訴求;另一方面,希望KPA能夠幫助視頻行業進一步提升視頻質量,推進視頻高清應用的發展。
Q
有哪些關鍵技術或研究趨勢正在/將會被應用在畫質評測相關的解決方案當中,AI在這當中扮演什么樣的角色?
樊鴻飛:在近幾年對AI的研究中發現,這項技術在眾多領域廣泛應用,且大幅度提升了各領域的原有性能,是算法的基本盤。在畫質評測相關的任務中,AI也幫助我們大幅度提升了SROCC和PLCC等指標。不過,我們仍然會遇到欠缺可解釋性的難題,這也是我們未來需要進一步關注的重點。
Q
圖像視頻評價指標的體系近幾年呈現出什么樣的趨勢,您如何看待其未來幾年的發展方向?
樊鴻飛:在此前的問題回答中也提到了,圖像視頻評價指標是一個非常大的研究課題,需要大量學者參與攻堅。目前學術界大部分研究都是基于較為少量的數據級,研究如何提升泛化性,對子維度、不同播放設備的研究較少,而這些卻都是實際應用中的剛需。
我們目前已經和香港城市大學評價指標研究領域的國際知名專家王詩淇老師及其團隊進行了緊密的合作。通過此次合作,我們將企業應用中真實的數據、需求反饋給了學術界,也得到了非常棒的學術研究成果。希望通過這次發布KPA,吸引更多學術界的學者們來研究這些課題。
Q
現階段正在解決的問題以及下一個階段的研發目標?
樊鴻飛:作為云服務商,我們致力于為用戶提供穩定的一站式視頻云服務。一方面,我們持續對視頻服務的核心指標進行提升,包括畫質、卡頓率、延遲、碼率等;另一方面,我們對未來視頻形式進行了探索,例如今年發布的4K/8K VR直播解決方案,以及服務于超高清開發者的金山云魔鏡平臺;下一階段,我們希望能推動整個行業在超高清視頻應用方面的落地,這一目標的實現需要整個鏈路上的持續優化。
本次LiveVideoStackCon 2020 北京站上發布的金山云圖像視頻感知評價指標Kingsoft Cloud Perceptual Assessment(KPA),是金山云與香港城市大學王詩淇老師團隊共同研發的成果,我們也希望能幫助行業來實現“讓視頻更加高清”的目標。
LiveVideoStackCon 2020?北京
2020年10月31日-11月1日
點擊【閱讀原文】了解更多詳細信息
總結
以上是生活随笔為你收集整理的客观指标VS主观质量:拨开遮挡高清视频技术的迷雾的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 多媒体技术生态未来的三个关键要素
- 下一篇: 腾讯云快直播——超低延迟直播技术方案及应