章琦:能坚持的唯一的原因就是兴趣
從虹軟、思科再到唐橋,章琦一直在關(guān)注視頻編解碼和實(shí)時(shí)通信開(kāi)發(fā)。作為架構(gòu)師,他認(rèn)為軟件設(shè)計(jì)和下圍棋一樣,都是“簡(jiǎn)單細(xì)胞組合成復(fù)雜藝術(shù)作品”的真實(shí)體現(xiàn)。LiveVideoStack郵件采訪了唐橋科技首席架構(gòu)師章琦,暢聊了自己成長(zhǎng)的過(guò)程,以及對(duì)多媒體技術(shù)生態(tài)未來(lái)的看法。
策劃 / LiveVideoStack
LiveVideoStack:章琦你好,能否簡(jiǎn)要介紹下自己,包括目前的主要工作及關(guān)注領(lǐng)域?
章琦:我畢業(yè)于浙江大學(xué)數(shù)學(xué)系,研究方向?yàn)閿?shù)字圖像處理。畢業(yè)后的第一份工作是視頻編解碼器的開(kāi)發(fā),有感于編解碼器之外的技術(shù)世界的瑰麗,于是輾轉(zhuǎn)于編解碼器之上層技術(shù)應(yīng)用。目前的工作是為唐橋科技設(shè)計(jì)下一代實(shí)時(shí)音視頻通信系統(tǒng)以及衍生于此系統(tǒng)之上的行業(yè)應(yīng)用。關(guān)注領(lǐng)域包括視頻編碼解碼技術(shù),實(shí)時(shí)通信,QoS,實(shí)時(shí)語(yǔ)音處理,人工智能,現(xiàn)實(shí)增強(qiáng),虛擬現(xiàn)實(shí)等。
LiveVideoStack:您怎么理解架構(gòu)師這個(gè)崗位?
章琦:架構(gòu)師承擔(dān)了企業(yè)中的技術(shù)方案制定,架構(gòu)設(shè)計(jì),未來(lái)技術(shù)戰(zhàn)略規(guī)劃等職責(zé),看起來(lái)雖然抽象,實(shí)質(zhì)上跟普通的程序員并無(wú)區(qū)別。對(duì)于架構(gòu)師而言,最大的成就莫過(guò)于以簡(jiǎn)單的結(jié)構(gòu),解決了現(xiàn)實(shí)中的復(fù)雜問(wèn)題。每個(gè)程序員也在做同樣的事情,無(wú)非是規(guī)模不同而已。我很喜歡程曉流在《圍棋發(fā)陽(yáng)論新解》中的一句話:無(wú)論結(jié)構(gòu)多么復(fù)雜的藝術(shù)作品,都是由許多簡(jiǎn)單的細(xì)胞組合而成。晶瑩的水滴固然澄澈無(wú)奇,它們一旦匯集起來(lái),大海的波濤又將是何等的瑰異綺麗。軟件設(shè)計(jì)領(lǐng)域, 同樣如此!
LiveVideoStack:從虹軟,思科,再到唐橋,一直沒(méi)有離開(kāi)多媒體開(kāi)發(fā)領(lǐng)域,究竟有什么原因讓你不離不棄?
章琦:能堅(jiān)持的唯一的原因就是興趣。
LiveVideoStack:虹軟和思科都是非常令人敬佩的公司,能聊聊在這兩個(gè)公司的難忘的經(jīng)歷嗎?
章琦:虹軟是我碩士畢業(yè)后的第一份工作,從此起步開(kāi)始學(xué)習(xí)視頻編解碼的算法和處理器相關(guān)的優(yōu)化。我能在多媒體開(kāi)發(fā)領(lǐng)域工作至今,很大程度是托了虹軟的福。我在虹軟工作的兩年,公司和領(lǐng)導(dǎo)給了我非常寬松的環(huán)境和給力的支持。我在虹軟負(fù)責(zé)H.264 Codec開(kāi)發(fā)的時(shí)候,技術(shù)方案的選擇上跟美國(guó)的大Boss有分歧,本地的Manager請(qǐng)我按照自己的想法繼續(xù)設(shè)計(jì)和實(shí)現(xiàn),所有的壓力由他承擔(dān)。至今想來(lái),仍覺(jué)感激。
思科是一家偉大的公司,我在實(shí)時(shí)通信領(lǐng)域所學(xué)習(xí)到的知識(shí),大多是源于在思科的經(jīng)歷。思科的同事中藏龍臥虎,技術(shù)大牛非常多,甚至能遇到業(yè)內(nèi)頂尖的高手,和他們共事,向他們學(xué)習(xí)。?
LiveVideoStack:對(duì)于那些非“科班”出身的多媒體開(kāi)發(fā)者如何更好的入門(mén)、深入學(xué)習(xí),您有哪些建議?
章琦:我也是非“科班”出身的開(kāi)發(fā)者,我曾和不少算法領(lǐng)域和應(yīng)用領(lǐng)域的開(kāi)發(fā)者有過(guò)交談,一個(gè)常見(jiàn)現(xiàn)象是: 算法領(lǐng)域的工程師輕視應(yīng)用,應(yīng)用領(lǐng)域的工程師則覺(jué)得算法設(shè)計(jì)非常高大上,難以學(xué)習(xí)。實(shí)際并非如此,除了極少數(shù)開(kāi)拓性的研究工作之外,絕大多數(shù)的技能都是普通人可以學(xué)習(xí)并精通。其關(guān)鍵還是在于保持專注,并能沿正確的方向堅(jiān)持下去。至于如何尋找正確的方向,現(xiàn)在互聯(lián)網(wǎng)上的資料非常多,基礎(chǔ)學(xué)科可以看公開(kāi)課,比較推薦網(wǎng)易公開(kāi)課。深入的領(lǐng)域則尋找業(yè)內(nèi)評(píng)價(jià)高的開(kāi)源項(xiàng)目以及相關(guān)資料學(xué)習(xí)。
LiveVideoStack:能否描述一下您典型的一天的日程?幾點(diǎn)入睡,幾點(diǎn)起床?
章琦:一般早晨7:00起床,12:00之前入睡。除了工作之外,還喜歡閱讀,喜歡讀的書(shū)除了技術(shù)類,還有歷史,數(shù)學(xué),圍棋,國(guó)學(xué)等等。還有一個(gè)日程是陪孩子玩,在孩子身上,似乎找到了過(guò)去的自己。
LiveVideoStack:回顧過(guò)去十多年音視頻通信技術(shù)的發(fā)展,取得了哪些突破?當(dāng)下還有哪些難點(diǎn)需要業(yè)界共同探索的方向?
章琦:視頻編碼技術(shù)從H.261,MPEG2(H.262),MPEG4/H.263,H.264/VP8,H.265/VP9/AV1,每一代編碼標(biāo)準(zhǔn)的更新,就帶來(lái)RD(碼率失真)性能的極大提升。以AEC為代表的語(yǔ)音處理算法也有了長(zhǎng)足進(jìn)步,網(wǎng)絡(luò)帶寬預(yù)測(cè)/丟包補(bǔ)償?shù)燃夹g(shù)在現(xiàn)在的實(shí)時(shí)通信領(lǐng)域得到了成功應(yīng)用,未來(lái)結(jié)合當(dāng)前的深度學(xué)習(xí)和自適應(yīng)算法,進(jìn)一步提升編碼算法的效率(H.266等),音視頻質(zhì)量增強(qiáng)(SR,deblur,denoise等),內(nèi)容分析,識(shí)別處理等,更準(zhǔn)確的預(yù)測(cè)網(wǎng)絡(luò)變化,效率更好的回音抑制算法(non-linear adaptive filter)等等,如何將AR/VR跟實(shí)時(shí)音視頻通信相結(jié)合等等, 都會(huì)是我們需要共同探索的方向。
LiveVideoStack:5G、4K乃至8K高清,給多媒體開(kāi)發(fā)生態(tài)帶來(lái)了哪些機(jī)遇和挑戰(zhàn)?
章琦:多媒體生態(tài)的發(fā)展離不開(kāi)硬件設(shè)備的成熟和基礎(chǔ)網(wǎng)絡(luò)的建設(shè),隨著5G時(shí)代的來(lái)臨,可以預(yù)想到的是用戶接入網(wǎng)絡(luò)帶寬的提升和流量費(fèi)用的進(jìn)一步降低,使高流量的4k甚至8k,VR視頻應(yīng)用成為可能。用戶體驗(yàn)的提升伴隨著網(wǎng)絡(luò)帶寬需求的上升,可以肯定是,網(wǎng)絡(luò)帶寬永遠(yuǎn)是不能滿足需求的。所以,視頻編碼的RD性能能否進(jìn)一步提升,網(wǎng)絡(luò)QoS算法是否能更加準(zhǔn)確的估計(jì)網(wǎng)絡(luò)帶寬,在弱網(wǎng)下能否提供平穩(wěn)的用戶體驗(yàn)會(huì)是永恒的挑戰(zhàn)。
LiveVideoStack:展望未來(lái),您看好哪些新興行業(yè)或應(yīng)用場(chǎng)景將會(huì)重度使用音視頻通信技術(shù)?
章琦:新興行業(yè)中IoT,自動(dòng)駕駛,機(jī)器人等等都需要依賴于音視頻處理及通信技術(shù),傳統(tǒng)行業(yè)比如教育,醫(yī)療,零售等也會(huì)越來(lái)越增加與音視頻通信技術(shù)的粘性,從而拓展出豐富的增值功能。
LiveVideoStack:您看好哪些新興的技術(shù)(如區(qū)塊鏈、AI等)與多媒體行業(yè)結(jié)合帶來(lái)新價(jià)值?
章琦:對(duì)區(qū)塊鏈了解不多,就談?wù)凙I技術(shù)吧。AI最有可能為多媒體行業(yè)帶來(lái)新的增長(zhǎng)點(diǎn)的新技術(shù),基于語(yǔ)音、視頻內(nèi)容的分析識(shí)別,基于深度學(xué)習(xí)的質(zhì)量增強(qiáng)算法等等,除了會(huì)改變多媒體應(yīng)用本身,還會(huì)讓多媒體技術(shù)跟新興行業(yè)和傳統(tǒng)行業(yè)融合,衍生出豐富多彩的行業(yè)應(yīng)用。此外,AR/VR技術(shù)的成熟,也勢(shì)必能激發(fā)出新的應(yīng)用類型和用戶體驗(yàn)。
LiveVideoStack:您如何看待WebRTC對(duì)行業(yè)的影響?相對(duì)于一些成熟的私有協(xié)議(如Zoom,WebEx等),WebRTC的短板是什么?
章琦:在2011年WebRTC未開(kāi)源前, 實(shí)時(shí)音視頻通信系統(tǒng)的搭建的技術(shù)門(mén)檻非常高, 能自己獨(dú)立研發(fā)這個(gè)系統(tǒng)的公司屈指可數(shù)。WebRTC的誕生及演進(jìn),不僅僅為瀏覽器應(yīng)用生態(tài)增加了多媒體功能,而且大大降低了企業(yè)自主研發(fā)音視頻通信系統(tǒng)的難度,現(xiàn)在的國(guó)內(nèi)的多媒體研發(fā)的火熱局面,WebRTC功不可沒(méi)。但是相比Zoom、WebEx這些成熟的系統(tǒng),WebRTC僅僅是一個(gè)實(shí)時(shí)音視頻通信的引擎,不包含信令系統(tǒng),也無(wú)法直接應(yīng)用于多方會(huì)議系統(tǒng),很多功能是缺失的,開(kāi)發(fā)難度依然不小。
WebRTCon 2018
經(jīng)歷了起跑、 熱炒、失落的7年長(zhǎng)跑后,伴隨1.0版定稿,獲得iOS端支持,WebRTC具備了打通主流生態(tài)系統(tǒng)和端的能力,2018年也將是WebRTC落地的最好時(shí)機(jī)。由LiveVideoStack音視頻技術(shù)社區(qū)出品,WebRTCon 2018將于5月在上海舉行,這是一次對(duì)過(guò)去幾年WebRTC技術(shù)實(shí)踐與應(yīng)用落地的總結(jié)。
本文受訪者也將出席,與大家分享、討論如何基于WebRTC設(shè)計(jì)多方視頻會(huì)議系統(tǒng),從而提供最優(yōu)的視頻通訊質(zhì)量。除此之外,還有其他全球領(lǐng)先的WebRTC技術(shù)專家,為參會(huì)者帶來(lái)全球同步的技術(shù)實(shí)踐與趨勢(shì)解讀。
點(diǎn)擊 [閱讀原文] 了解更多相關(guān)信息,快來(lái)報(bào)名吧!
總結(jié)
以上是生活随笔為你收集整理的章琦:能坚持的唯一的原因就是兴趣的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 聚焦北京,探秘多媒体开发新趋势(内附资料
- 下一篇: 小哥哥,WebRTC 了解一下