见良:学习多媒体主要靠实践
LiveVideoStack郵件采訪了北京美攝網絡科技有限公司CTO 見良,作為十多年的多媒體老兵,他認為學習多媒體技術主要通過實踐,必須在實際的項目中鍛煉自己。對于未來,機器學習結合計算機圖形學可以實現智能剪輯,制作出更有趣的視頻。
文 / 見良
策劃 / LiveVideoStack
LiveVideoStack:見良你好,能否向LiveVideoStack的讀者介紹下自己,以及目前主要的工作以及關注的技術方向?
見良:目前主要是移動端高質量的視音頻技術解決方案,包括視音頻的采集,編輯,特效合成,為各種視音頻應用提供底層技術支持。目前主要關注視音頻處理架構設計,算法設計,視音頻AI處理。
LiveVideoStack:15年來一直在從事視頻處理相關的研發,沒有考慮過更換個技術方向嗎?如何保持對技術的好奇心?
見良:視音頻技術總是在不斷發展的,以前用傳統計算機圖形學、圖像處理算法難以解決的問題,現在通過卷積神經網絡能解決的相當不錯。同時市場用戶不斷提出新的要求,不再滿足一般低質量、五毛特效,要求效果越來越真實,更炫酷,更簡便。廠商要求技術也越來越高,更高的清晰度,更小的資源,更高的效率。
LiveVideoStack:一種觀點認為,現在做多媒體開發比十年前容易很多,因為有許多強大的開源框架、工具(如WebRTC、FFmpeg、x264),您怎么看這種觀點?
? ? ?
見良:確實是強大的開源框架能助力開發,但是視音頻處理要求更高,所以開源的項目要謹慎選擇,它們普適性很強,為了追求更好效果、更高的質量,我們有自有的高效率框架,在需要的地方合理的去使用這些開源技術。
LiveVideoStack:搞多媒體開發需要學習大量的基礎知識,而且需要在實際工作中摸爬滾打。對于學習多媒體開發,您有哪些建議?能否推薦一些多媒體開發相關的學習資料或書籍。
見良:學習多媒體主要靠實踐,比如可以閱讀一些開源項目的源代碼(比如FFmpeg,GStreamer等)并使用其做一些簡單的項目,如果參與到其開發中那就更好了。此外再接觸一些商業的多媒體框架,比如DirectShow, MediaFoudation, AVFoundation等等,這樣可以比較快速地了解多媒體的基本概念以及基本處理流程。
LiveVideoStack:您認為CTO的核心職責包括哪些?是否需要寫(或review)代碼呢?
見良:CTO主要確定公司的技術方向,構建公司的技術體系,為公司的戰略提供強有力的技術支撐。CTO在每個階段的工作重點是不一樣的,是有必要寫代碼的。
LiveVideoStack:您主導開發了敦煌視覺效果合成系統,能否簡單介紹下這個產品。在研發的過程中,有哪些難忘的故事?
見良:敦煌視覺效果合成系統是國內第一款后期合成包裝系統,這個產品主要面向電影,電視劇廣告的后期合成包裝,它涉及顏色校正,摳像,遮罩,跟蹤,三維攝像機反求等等非常復雜的算法,它的定位是頂級的視音頻合成系統,也是獲得國家科技進步一等獎項目的技術核心部分。最難忘的是當時我們做算法就封閉開發了一年多,算法效果出來后我們請了國內頂尖的做后期合成的專業人士來幫我們看這些效果是否可以用于高端視音頻制作了,經過專家三天的詳細測評對比給了相當滿意的結果,這樣我們有堅定的信念去軟件架構的搭建和應用軟件的開發了
LiveVideoStack:能否介紹下美攝SDK這個產品,他有什么技術特點?
? ??
見良:兼容性,高效率,高質量,可擴展性。
LiveVideoStack:音視頻領域還有哪些學界、工業界公認的難點?未來幾年,哪些難點有可能取得突破?
? ? ?
見良:智能的剪輯合成是困難的,未來通過機器學習的技術結合傳統計算機圖形學圖像處理能有效降低視頻制作的難度,同時提供有趣的視頻玩法出來。
總結
以上是生活随笔為你收集整理的见良:学习多媒体主要靠实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSU发布2018年视频压缩评比报告
- 下一篇: LiveVideoStackCon讲师热