腾讯云张贤国:北大将我从少年变成了技术研究者
在LiveVideoStack采訪的幾十位多媒體技術人中,畢業院校比例排名前三位是清華、北大和上海交大。他們有的耕耘在大學講壇,輸出一波波人才。有的移居海外,在全球頂尖科技公司擔當技術領導人。有的還在技術一線追求極致。有的正在從技術人到創業者蛻變的路上,開啟一片新天地。今天的采訪對象是來自騰訊云的張賢國,擁有十分華麗的履歷。不過更吸引我的是他在北大的十年遇到的兩次坎兒,坎兒有多痛,過了坎兒就有多爽。作為云架構平臺部-編碼內核組的負責人,張賢國還在追求極致的路上。
文 / 張賢國
策劃 / LiveVideoStack
?
LiveVideoStack:張賢國你好,很榮幸代表LiveVideoStack對你進行采訪,能否向LiveVideoStack的讀者介紹下自己,以及目前專注的領域。
?
張賢國:很榮幸能成為LVS講師中的一員。本人2003-2013年就學于北京大學,博士畢業后在MediaTek從事了兩年HEVC相關標準的提案工作,并一作采納8項提案。2015年加入仟壹后被并購至金山云,專門從事自己富有興趣的領域——高性能高速視頻編碼器的研發工作。2017年來到騰訊,作為專家工程師和技術負責人之一,與同事們合力自研了騰訊服務端編碼器V265。目前作為云架構平臺部-編碼內核組的負責人,仍專注于商用視頻編解碼器的研發工作。
?
LiveVideoStack:為什么選擇專注于視頻編碼這個領域,有何吸引你的地方?您在北大10年中,最大的收獲是什么?
?
張賢國:在我大學四年級的時候,高文院士來到北京大學任教,我有幸保送至高老師的數字媒體研究所攻讀博士學位。不論在MTK、仟壹、金山云還是騰訊,都有很多師兄弟的指導或者輔助,是高老師整個團隊將我引入并專注于這個領域。
?
視頻編碼吸引人的地方首先在于它是一個不斷追求極致、并且有很完善的評價體系的領域,哪怕一個很小的優化都可以被看到;其次在于它跟大家的生活息息相關,做好視頻編解碼是可以給大家帶來切實的生活品質提升的;總之,視頻編解碼是個可以充分體現技術和工作價值的領域。
?
北大的10年把我從一個來自農村的憨直少年轉變成一個有目標、有理想的技術研究者,內心上經歷過的兩次磨礪是我最大的收獲:
(1)從大一時對計算機的不熟悉和成績的不理想到大三時完成技術積累保研至高老師團隊,拿到了計算機行業從業者的合格證;
(2)從研究生伊始難以兼顧學業和實驗室項目到2013年三篇IEEE Transaction畢業,拿到了視頻編碼領域技術研究者的合格證。
?
LiveVideoStack:看起來聯發科和騰訊是兩種不同風格的公司,在您的工作中有什么不一樣的體會?
?
張賢國:因為一直從事的是后臺研發相關工作,感覺其實差別不是很大,可能代碼和測試環境管理上,MediaTek更嚴謹而騰訊更靈活。真正感受不同之處在于工作內容:MediaTek在視頻編碼標準制定領域,無論是HEVC還是VVC都一直保持著TOP3的提案采納量,研究內容一般是三五年以后才可能(但未必)會用到的。騰訊則在視頻編碼器研發領域有著多年的積累,給用戶以可見的更優秀的實際產品體驗,研究內容會更關注于實際應用場景下的主客觀效果。來到騰訊,能把MediaTek在標準制定領域嚴謹的工作方法與騰訊內部快速迭代的工作作風做一個結合,也是非常愉悅的體驗。
?
LiveVideoStack:我們知道您所在的團隊參加了MSU編碼大賽,這里有哪些有趣的故事?
?
張賢國:MSU比賽堅持了這么多年,還是比較有公信力的。我們編碼團隊是2017年中開始組建并工作的,剛開始也是想通過MSU比賽橫向對比看看 我們的研發水平和行業的差距,也方便我們好進一步的改進。由于2018年3月就要提交程序,起初我們也只是關注壓縮率參加慢速檔。不過做著做著大家都很有熱情,一口氣把中速和快速都做了,時間其實是非常緊張的。最后的比賽成績還不錯,同時也給了我們很好的Badcase樣本——比如MSU在2018年增加的大量的簡單、復雜場景切換視頻。總之,MSU比賽極大程度得幫助了V265在2019年的大幅度完善并快速落地。
?
LiveVideoStack:從產品角度我們可以看到騰訊云視頻用戶體驗的提升,作為底層支持的V265目前正在做哪些改進?它對比H.265、AVS3有哪些區別與優勢?
?
張賢國:V265是一款通用的服務端編碼器,面向的是各種視頻場景的編碼優化。目前,V265正在進行持續的迭代優化工作——繼續提升慢速檔的壓縮率,繼續添加更快的編碼檔次,繼續支持更多的場景類型調優。V265編碼器目前是H.265標準的encoder實現,所產生的碼流都是符合H.265格式的,AVS3是超過H.265和AVS2的下一代視頻編碼標準。所以V265編碼器和H.265/AVS3標準還無法橫向比較。但從參考代碼來看,V265編碼器相比標準參考軟件會增加大量不修改標準的encoder優化工具,以數據結構和匯編優化、預分析和碼率控制、自適應量化和預測關系優化、以及各種加速算法為代表。
?
LiveVideoStack:5G以及AI技術的發展是當下非常熱的話題,您覺得這些給編碼器的設計帶來哪些機會和挑戰?
?
張賢國:5G相比4G的兩大突出優勢在低延遲和高帶寬。低延遲要求編碼器設計要為低延遲應用服務,比如V265編碼器已經支持zerolatency編碼,并著重在預測關系和碼率控制上提升了zerolatency下的壓縮率;高帶寬要求編碼器在高碼率、高分辨率、高bit深度下表現優異,因而編碼器迭代優化時的測試集合要涵蓋8bit和10bit, 高中低碼率和分辨率,比如V265的140個8bit視頻、20個10bit視頻的測試碼率點范圍也會在QP 20-40 的基礎上擴展碼率范圍至可能的5G碼率點。
?
AI技術是非常好的編碼器優化工具,除了已知的騰訊云極速高清-內容自適應編碼,V265在碼率控制上就嘗試了用AI的方法來估計一幅圖像的碼率以輔助碼率控制流程。這里面的挑戰點在于找到AI和編碼器優化的結合點,怎么能在復雜度限制的條件下,將AI工具高效的利用起來。
?
LiveVideoStack:業界預測8K HDR將在2022年得到普及,V265對這方面是否有些規劃?騰訊云產品側未來是否有所提前布局?
?
張賢國:V265 2019年完成的一項重要工作就是對10bit編碼和杜比HDR畫質的支持,這也是考慮到越來越多云服務客戶有HDR視頻內容的需求。8K HDR 轉碼服務目前V265編碼器也是可以支持的,但從最優化的角度來看,需要開發符合新一代標準的編解碼器來全面提升畫質、壓縮率和觀看體驗。在8K HDR方向,騰訊云已經開始布局HEVC并研究下一代標準的軟硬件服務。
?
LiveVideoStack:在軟硬結合編碼壓縮上,騰訊有哪些進展與突破?
?
張賢國:目前主要有兩個技術方向,一是與硬件編碼器廠商合作,將V265編碼器的碼率控制、自適應量化等優化算法添加到硬件板卡的碼率控制層甚至物理層提升硬件轉碼的效率,目前已經有一些進展。二是從頭開始自研硬件視頻編碼器,目前這方面還處于探索階段。
?
LiveVideoStack:針對于AI+編碼技術,騰訊云也有明眸、智眸產品,您認為他們更適合于哪些場景的落地?未來發展的方向是怎樣的?
?
張賢國:AI+編碼技術中,騰訊明眸產品面向的是視頻點播和直播的畫質處理和轉碼服務,目的在于提升騰訊云轉碼服務的體驗。而智眸產品則是面向自內容生產者,用于高效率完成視頻編輯、發布和視頻生產。明眸產品中,本人專門參與過極速高清編碼部分工作,后面會繼續加強參數預測的準確度,尤其是直播場景和ROI編碼場景;智眸產品本人了解較少,但相信騰訊云在音視頻實驗室和優圖實驗室的大力支持下,一定會不斷迭代,滿足用戶需求。
?
LiveVideoStack:騰訊自身有諸多的音視頻相關產品,包括基于騰訊云實時音視頻、通信產品,以及日常使用的微信通話、小程序等等,從技術角度是如何滿足不同場景下低延遲和高畫質需求的?
?
張賢國:從我個人的理解來看,自適應帶寬監測、碼率控制、自適應丟幀編碼和網絡抗誤碼都是滿足低延遲高畫質編碼的關鍵;當然,編碼器在低延遲編碼下速度-質量效果是基礎,包含預測關系、參考結構、位率分配、標準格式等。騰訊已經在微信和QQ上打磨多年,相信一定可以給騰訊云客戶帶來優秀的體驗。
?
LiveVideoStack:針對實現“極速高清-智能動態編碼”,騰訊云在技術層面遇到哪些困難與挑戰?
?
張賢國:極速高清-智能動態編碼的特點是智能計算符合業務需求的轉碼質量參數和轉碼工具參數。在優化過程中的難點在于如何找到可以提升AI預測準確率的編碼特征以及如何構建AI預測的訓練數據集。以編碼特征尋找為例,使用簡單時空特征下,預測出轉碼VMAF>95的最大crf的準確率只有50%,在擴大數據集的多樣性以及找到更準確的編碼特征后,才將準確率提升至90+%。
探秘云游戲背后全鏈條實時音視頻技術實踐
上周剛剛結束的Chinajoy上,我們看到了騰訊云帶來的30G大型游戲云端秒開的流暢體驗,這背后的支持無疑是超低延遲的音視頻流。從智能動態編碼、到網絡傳輸優化、再到多終端適配,騰訊云展現了一個完備、高質量、高可用的視頻產品鏈。
8月24日·北京 | LiveVideoStack聯合騰訊云邀請多位技術專家,立足實踐,為開發者360度深度解析騰訊云音視頻及融合通信技術奧秘,現場更能體驗騰訊云最新、最佳技術實踐。
總結
以上是生活随笔為你收集整理的腾讯云张贤国:北大将我从少年变成了技术研究者的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 探秘云游戏背后实时音视频技术实践
- 下一篇: 【大会】延迟还能再低点吗?不能,但也能