张光:鸿沟已成坦途
作為一名在音視頻領域摸爬滾打多年的老兵,見證了行業的不斷發展與變化,其中感觸最深的是隨著基礎的不斷改善,很多以前不可逾越的鴻溝都已經變成了坦途,張光說到。LiveVideoStack采訪了三體云技術副總裁張光,暢談了音視頻技術的發展變化與挑戰。
文 / 張光
策劃 / LiveVideoStack
LiveVideoStack:張光你好,能否向LiveVideoStack的讀者介紹下您自己,以及目前主要的工作和關注的技術方向?
張光:大家好,我是張光,來自北京三體云,一名在音視頻領域摸爬滾打十多年的老兵。目前主要負責三體云實時音視頻服務的開發。對與實時音視頻相關的技術和領域如AR、VR等高度關注,同時也非常看好AI在實時音視頻領域的落地。
LiveVideoStack:在音視頻領域從事研究與開發工作10余年,能否從您的角度為大家分享一下音視頻技術的發展與演進?
張光:在音視頻領域內從事這么多年工作,也見證了行業的不斷發展與變化。其中讓我感觸最深的就是隨著基礎的不斷改善,很多以前不可逾越的鴻溝都已經變成了坦途。
當年剛剛從桌面系統開始向移動端發力的時候,智能手機的軟硬件系統還處于非常初級的階段,無論是手機的性能還是系統API提供的能力都不足以支撐實時音視頻通訊的需求,root、私有接口以及其他“非常規”的做法都在這個時期使用過。同時3g網絡也無法支撐較高質量的音視頻,網絡的不穩定又使得即便是較低質量的音視頻在手機上的體驗也非常糟糕。因此在當時移動端的實時音視頻通訊能力僅僅只是作為桌面端的一個附庸,是銷售在面對客戶爭搶訂單時的一個加分點而已,實際使用者寥寥無幾。
隨著智能手機軟硬件的提升,4g網絡的全面鋪開,同時感謝WebRTC的開源,移動端上的實時音視頻的開發變得更加簡單,實用性變得比以往任何時候都好。到現在每天看到有如此之多的移動端用戶在三體云上進行實時音視頻的交互,這讓我們感到無比的自豪和欣慰。
另外一點讓我感受很深的是市場變得更加成熟。早期在做傳統視頻會議的時候,也曾為用戶提供過SaaS的服務,后來被迫中止。產品力是一個方面,另一方面市場對公有云服務的接納程度一般,用戶寧愿買下一套軟件自己部署和維護。
LiveVideoStack:三體云的業務涉及泛娛樂,在線教育,視頻客服等多種場景及行業領域,能否簡單介紹在實現這些業務場景的過程中存在哪些挑戰?
張光:單就在線教育而言,最初我們介入這個行業領域的時候,想的非常簡單,認為它就是實時音視頻技術的外延,無非就是增加了白板、課件等功能而已,我們只要簡單的加上這些功能自然就會有客戶買單。但當我們真正面對客戶的時候才發現當時的想法太過天真。閉門造車無法真正的直擊用戶的痛點,沒有深入到行業內驅,不了解用戶的真實需求,是無法提供讓用戶滿意的產品的。我們已經和仍在繼續做的事情就是真正的深入到行業內部,從用戶處獲取最真實的需求,并且提供超越用戶預期的產品。
LiveVideoStack:PC端,移動端多媒體技術的發展,可以說很大程度上改變了人們的娛樂方式,三體云針對泛娛樂場景又有怎樣的創新和規劃?
張光:泛娛樂的應用場景有很多,目前比較主流的玩法有:直播連麥,音頻電臺,純音頻的多人交友以及帶視頻的多人交友、主播PK(市面上的玩法基本是主播1對1之間的PK,各自主播的觀眾所觀看的內容有區別)。目前三體云可以支持多主播跨房間進行PK,并且可以實現與主播直推CDN的無縫切換;在線KTV的玩法也是我們目前所支持的,并同時提供歌詞字幕同步的功能。而合唱的玩法由于延遲的問題目前還無法完美實現,但我們正在嘗試在5g下將延遲降低至30ms以內,以達到比較完美的合唱體驗;此外三體云還支持變聲、美顏等泛娛樂場景幾乎必備的功能。同時我們也正在積極探索AR、VR等技術在未來的娛樂場景中的實際應用。
LiveVideoStack:我們可以看到用戶對于清晰度、流暢度、實時性的追求從未終止,三體云在針對用戶體驗質量方面做了哪些工作?
張光:最初的時候我們經常只能通過用戶的反饋來發現一些問題,然后進行改進,這樣的方式不但效率低下,而且發現問題過于滯后。 為此我們建立了一套實時的質量監控體系,可以讓我們在用戶出現狀況的同時、甚至早于狀況發生就發現問題。除了對個例的分析改進,我們還通過對質量監控體系關鍵指標的不斷優化,來提升整體的用戶體驗。
LiveVideoStack:5G的到來拓寬了多媒體發展的道路,在您認為5G將會為實時視頻通訊技術帶來哪些機遇與挑戰?
張光:就像前面提到的4G為當前的移動互聯網的實時音視頻奠定基礎一樣,5G時代的到來必將帶來更大的改變。
最直接可以看到的改變就是目前某些對延遲要求非常高的一些應用場景將變得更加實用。比如我們目前所熟悉的移動端K歌場景,基本無法做到兩人同時合唱,各家的實現均是通過放棄掉一定的互動性來完成,相信5G時代的到來,更低的延遲將會使得這個問題迎刃而解。
盡管在4G的網絡下用戶在絕大部分時間都可以獲得良好的實時音視頻體驗,但在弱網環境下依然可能帶來流暢度和畫質的降低。而5G蜂窩數據傳輸速度的巨幅提升,將使得我們可以為用戶提供更穩定更高質量的音視頻服務。
AR/VR一直是個人比較看好的應用,4G下盡管已經有了一些實現,但目前看來用戶體驗都不是特別滿意,相信在5G時代會有質的飛躍。
LiveVideoStack:能否為大家簡單劇透下您在LiveVideoStackCon 2019北京上的分享內容?
張光:三體云作為一家實時音視頻服務提供商,致力在任何情況下為用戶提供高可用的實時音視頻服務。本次我將從容災、報警機制、智能調度、質量監控等方面講解三體云如何為用戶提供高可用的服務。
LiveVideoStack? 招募
LiveVideoStack正在招募編輯/記者/運營,與全球頂尖多媒及技術專家和LiveVideoStack年輕的伙伴一起,推動多媒體技術生態發展。了解崗位信息請在BOSS直聘上搜索“LiveVideoStack”,或通過微信“Tony_Bao_”與主編包研交流。
點擊【閱讀原文】或掃描圖中二維碼,了解更多大會講師及分享內容信息!
總結
- 上一篇: 揭秘腾讯云最新音视频及融合通信技术实践
- 下一篇: Instagram视频上传延迟优化