张睿:OpenH264拥有产品级的鲁棒性 欢迎contribute
張睿擁有超過20年多媒體領域研發經驗,是WebEx視頻會議系統的媒體架構師,同時也是OpenH264的項目負責人,她在LiveVideoStack的采訪中表示,思科不僅貢獻了高魯棒性的代碼,還承擔了IP費用,希望能與AV1一樣幫助多媒體生態健康發展。
策劃 / LiveVideoStack
LiveVideoStack:張睿你好,能否向LiveVideoStack的讀者介紹下自己,以及目前主要的工作以及關注的技術方向?
張睿:我目前是思科公司Cisco Systems的主任工程師(Principle Engineer)。是網訊WebEx Meeting系統的媒體架構師。我在數字信號處理和多媒體通信領域擁有20多年的研究和行業經驗,在圖像/視頻壓縮,音頻/視頻處理和視頻會議方面擁有豐富的專業知識。
我多年來一直在主持整個會議系統的音視頻解決方案。我的團隊也是思科OpenH264項目的所有者。在加入思科系統之前,我還曾在索尼SONY研究實驗室和一家H.264編解碼器芯片設計的初創公司工作過。我在加州大學圣巴巴拉分校電子與計算機工程系獲得了博士學位,并在斯坦福大學電氣工程系進行過信號處理和媒體傳播領域的博士后研究。
LiveVideoStack:為什么選擇數字信號處理與多媒體通信這個領域呢?并且一直持續超過20年,如何保持對技術的熱情和好奇心?這一領域有什么特別的魅力嗎?
張睿:我是在讀本科的時候就選擇了這個方向的。我當時在北京郵電大學就讀。最初覺得通信給人類提供了便利,拉近了人們的距離,覺得很有貢獻感,成就感。然后學信號處理的時候,尤其是頻譜分析,覺得很有美感。到大四的時候,選擇實驗室,覺得多媒體更貼近用戶的直覺感受,就選擇了這個方向。一路走下來,先是在讀博士的時候追求理論的解釋和細節的完美,享受數學變成可以聽可以看的過程;再到這么多年來做越來越大規模的工程,體會整體設計對終端用戶體驗的重要性,很自然的就保持了熱情和好奇心。對于我而言,多媒體是科學和工程帶給人類的最直觀的體驗。其實我最大的愿望是能在教育領域通過多媒體的技術給孩子們更直觀的體驗,從而熱愛科學,熱愛世界。可惜到目前為止還沒有機會在相關領域工作過。
LiveVideoStack:回顧過去20多年,多媒體技術領域發生了哪些變化,又有哪些沒有變化呢?
張睿:大概因為人在此山中吧,體會到的都是漸變。
從大的方面講,應用場景決定對技術的需求和技術的解決方案。回顧過去20多年,多媒體領域的應用越來越寬廣。在消費者領域,這些年整個的音視頻娛樂已經從傳統的電視臺和廣播電臺迅速轉移到網絡平臺和自媒體,相應地技術迅速發展。在通訊方面,多媒體已經是社交媒體中重要的一部分,無所不在,不需要像以前一樣購買昂貴的終端設備。
在技術層面上,一直在解決的是更好(的質量)更有效(的帶寬)更快(的迭代)更廣(的部署)。所以音視頻編解碼的基本技術和網路傳輸的基本技術還在沿著一個方向像更深處走。另一個方面,復雜算法的發展和底層計算能力的增強,使得信號識別分析領域在應用中開始開拓更廣泛的用武之地。語音/圖像/視頻的識別和分析帶來了大量的應用,機器學習的方法正在取代一些傳統的信號處理的方法。
LiveVideoStack:你的團隊負責OpenH264項目(https://github.com/cisco/openh264),相比于x264,OpenH264的名氣要小一些。能否介紹下OpenH264有哪些特色?未來還有哪些功能改進或新增?
張睿:非常客觀的講,當初這個項目啟動的最大原因是推動H.264在WebRTC中的應用。思科Cisco為此決定把內部產品的代碼開源并且支付其中IP使用的費用。希望在推動業界使用H.264方面,從技術和費用上都提供幫助。這和Google目前推廣AV1是在解決同樣的問題。
技術層面上,OpenH264是出于產品代碼,而產品是在視頻會議應用上面,所以大多數算法和速度的優化都是以此為目標,并不代表更廣泛的應用。同樣因為是出于產品應用,OpenH264代碼的質量和魯棒性是很經得起考驗的。思科Cisco歡迎其他公司和社區程序員根據他們的應用需求直接貢獻代碼,共同促進普及應用。在思科內部,我們還是集中在和視頻會議應用相關的場景需求上,比如屏幕共享時的編碼方案。
LiveVideoStack:搞多媒體開發需要學習大量的基礎知識,而且需要在實際工作中摸爬滾打。對于學習多媒體開發,您有哪些建議?能否推薦一些多媒體開發相關的學習資料或書籍。
張睿:對我個人而言,早年在學校的基礎知識很重要,會一直幫助融會貫通。后來是期刊論文,對某一個課題的深入了解有很大幫助。再后來,就是大量的國際標準的閱讀。另外就是相關的論壇,能幫助解決一些實際的問題。很慚愧,最近幾年并沒有很系統的閱讀。也許是應該停下來充電的時候了。
LiveVideoStack:如果讓你來預測2018年多媒體生態圈的技術關鍵詞,你會選哪些?你看好哪些多媒體相關的技術?
張睿:把我問倒了。不是個關鍵詞控:-)我所在的視頻會議領域相對成熟,能看到的是人工智能技術在此的更多應用。我也比較關注AV1,希望它的產業化能夠足夠快。
LiveVideoStack:未來5G的網絡條件下,帶來哪些機遇和改善?比如,網絡的穩定性會提升,但隨著帶寬的暴增,會帶來帶寬/CDN成本的大幅增長。
張睿:哈哈,Cisco希望更多的網絡帶寬應用啊!我個人認為這還是在延續一直以來的趨勢。如果現在去買個顯示器,都是4K的屏幕了。內容本身容量的增大帶來了對帶寬的需求。我們將看到更多細分化的產品線。對現有產品,肯定是會帶來質量的提高。成本上的增加,最終還是要體現在產品帶來的價值上。
LiveVideoStack:說說你將在LiveVideoStackCon 2018分享的內容吧。
張睿:我將談兩個話題,都是在產品開發中得到的很實際的一些體會。一個是如何通過跨層和組件的全局優化來提高視頻會議中的實時質量。另一個是利用自動化測試和產品數據化監控保障媒體質量。前者側重在流水線的端到端設計,后者強調測試和監控在現代化的軟件開發流程的重要性。
總結
以上是生活随笔為你收集整理的张睿:OpenH264拥有产品级的鲁棒性 欢迎contribute的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 刘歧:FFmpeg Filter深度应用
- 下一篇: LiveVideoStackCon讲师热