谁在驱动腾讯会议?腾讯旗下又一顶级实验室浮出水面
乾明發(fā)自凹非寺
量子位報道公眾號QbitAI
騰訊為解決開會問題專門開了個會。
聽起來像個段子,但這就是騰訊最新產(chǎn)品騰訊會議的核心概括。
這款云視頻會議產(chǎn)品,宣稱集結(jié)騰訊在 AI、云計算、安全等方面的能力,能全方位滿足不同場景下的會議需求。
這款一推出就引發(fā)關(guān)注熱議的產(chǎn)品,其實孵化自騰訊內(nèi)部一個神秘的實驗室。
名曰:騰訊多媒體實驗室
解碼騰訊頂級實驗室
騰訊多媒體實驗室,現(xiàn)隸屬于騰訊 CSIG,由騰訊高級執(zhí)行副總裁湯道生主管,前身是騰訊音視頻實驗室、QQ 音視頻中心。
官方定位是“騰訊旗下頂尖的音視頻通信和處理研發(fā)團隊”。
主要的研究方向為:包含實時音視頻在內(nèi)的多媒體壓縮、傳輸和通信,音視頻質(zhì)量評估,互動沉浸式媒體、智慧媒體等。
實驗室官網(wǎng)介紹稱,在“實時音視頻通信和處理技術(shù)、音視頻國際標準等領(lǐng)域積累了完整的解決方案和領(lǐng)先的技術(shù)水平。”
騰訊多媒體實驗室高級總監(jiān)商世東在接受采訪時,也給出了數(shù)據(jù)證實其技術(shù)實力:
多端通話端到端延時,在 150ms 左右。在公認的國際標準中,這是衡量通話質(zhì)量是否好的核心標準。
尤其是在互聯(lián)互通的會議場景中,網(wǎng)絡(luò)狀況、終端設(shè)備、使用場景等極為復(fù)雜,每一個細小變量都可能相當于“蝴蝶在亞馬遜流域扇動了一次翅膀”,對最終結(jié)果產(chǎn)生極大影響。
在這樣的條件下,保證如此優(yōu)質(zhì)的實時音視頻通信能力,在全球少有公司能夠?qū)崿F(xiàn)。
商世東說,騰訊會議就是這些領(lǐng)先技術(shù)的直接呈現(xiàn)。
開會的本質(zhì)是要高效互聯(lián)互通
騰訊為什么要做騰訊會議?產(chǎn)品剛一發(fā)布,這個問題再次擺到了騰訊云副總裁吳祖榕面前。
他也是騰訊多媒體實驗室總經(jīng)理,騰訊會議項目的牽頭人。
“在過去的一年時間里,我經(jīng)常會被問到這個問題,”他說。“在騰訊的體系下,很多人會覺得說開會就是這樣,微信一個語音拉起來,似乎這個問題就解決了。”
但這并不是會議的本質(zhì)。吳祖榕認為,開會要解決的是高效溝通跟專業(yè)的協(xié)同問題。
這也就決定了僅僅依靠微信或者 QQ 語音/視頻通話,以及會議室的電話設(shè)備等終端根本不夠用,也不適合用來在會議場景中,去解決更專業(yè)的問題。
一方面在于設(shè)備,微信和 QQ 等通訊軟件載于手機或者電腦,解決小范圍溝通可以,但更大更多的人呢?每個人都舉著手機或者抱著電腦打電話?
同時,在使用通訊軟件的時候,會議室的電話、電視等終端設(shè)備,也無法互聯(lián)互通。至于采用會議室的電話設(shè)備等終端,這是把人都綁定在了設(shè)備上,便捷性也沒法保證。
另一方面,多設(shè)備之間的電話與視頻溝通,對于網(wǎng)絡(luò)也有很嚴格的要求,網(wǎng)絡(luò)問題導(dǎo)致通話斷斷續(xù)續(xù),也大大降低了溝通效率。
這些都是當前企業(yè)內(nèi)或跨企業(yè)多地開會存在的種種痛點,也是騰訊發(fā)布騰訊會議產(chǎn)品的出發(fā)點。基于騰訊在音視頻通信領(lǐng)域 20 多年的積累,騰訊多媒體實驗室表示有信心能解決這些痛點。
在設(shè)備方面,他們打通了 VoIP 和 PSTN 傳統(tǒng)話機等多種接入設(shè)備,支持從窄帶、寬帶到超寬帶等多種采樣率和帶寬,不管是手機、電腦,還是電話、電視等等,都能接入騰訊會議的系統(tǒng)。
在保證網(wǎng)絡(luò)穩(wěn)定性方面,利用了業(yè)界領(lǐng)先的帶寬預(yù)測和流量控制技術(shù);在音質(zhì)提升方面,通過基于深度學(xué)習(xí)的音頻超分辨力和智能降噪技術(shù),進一步確保用戶能接收到更加高清的語音品質(zhì),可以提升語音通信的可懂度和主觀體驗。
而且,考慮到語音通話系統(tǒng)的復(fù)雜性,騰訊多媒體實驗室還打造了面向真實網(wǎng)絡(luò)場景的語音質(zhì)量運維和保障方案,能實時檢測通話的質(zhì)量、對雜音和嘈雜聲進行快速定位,持續(xù)保障高品質(zhì)通話。
效果怎么樣?騰訊會議產(chǎn)品發(fā)布時也給出了數(shù)據(jù):基于騰訊云的網(wǎng)絡(luò)支撐,能實現(xiàn)最低 80ms 的超低延時,就算視頻丟包 70% 也不會花屏和卡頓。
對于會議來說,這些都是根本。但對于騰訊會議來說,這只是起步。
用美顏降噪,重新定義開會
在騰訊會議中,騰訊的產(chǎn)品力也有充分的體現(xiàn)。
你能想到,一款視頻會議產(chǎn)品中,竟然有美顏和背景虛化功能嗎?但這就是騰訊會議的一些亮點功能。
“面對突如其來的視頻會議,可能很多女同事會擔心自己還沒化妝,”商世東說。“我們就把我們原來用在相機里面的美顏算法也用到了會議中來。”
而且不僅僅是手機端,Mac、windows 電腦客戶端上也都能美顏。
此外,騰訊會議還上馬了降噪功能,這也是騰訊多媒體實驗室的看家本領(lǐng)之一。
在商世東的描述中,這是他們延續(xù)C端產(chǎn)品的地方,初步降噪之后,還會針對會議的一些常見的噪聲,例如:鍵盤聲、咳嗽聲、放水杯的聲音,進行定點降噪。
“這里面的每一個點點滴滴,都是需要產(chǎn)品經(jīng)理和研發(fā)人員仔細地去打磨,不斷地做改進,”商世東還描述了這樣一個場景:
為了手機樣本,騰訊的工程師會拿著錄音設(shè)備去公交車地鐵站臺采集很多移動場景中的噪音,然后把這些采集到的噪聲加入平臺去做語音降噪的訓(xùn)練。
在他看來,這背后是對他們產(chǎn)品體驗不斷的追求,畢竟“好的產(chǎn)品他自己會說話”。
但作為一款技術(shù)驅(qū)動型的產(chǎn)品,體驗也都需要建立在技術(shù)上。騰訊會議發(fā)布后,也為其贏得了諸多好評。
騰訊何以能?
一方面得益于龐大的用戶體量,使其能夠有足夠的數(shù)據(jù)和場景去優(yōu)化技術(shù);另一方面是人才,騰訊的確招攬了一批頂級人才來進行研發(fā)。
當然,這背后還有一個不能忽視的因素,騰訊上手真的很早,歷經(jīng)了多年迭代。
從 QQ 中心小團隊,到騰訊技術(shù)底座
說起 20 多年音視頻通訊經(jīng)驗積累,要追溯到 1999 年,這時騰訊剛成立一年,QQ 還被稱為 OICQ 剛剛問世,音頻通話是其基本功能之一。
視頻聊天功能,作為 OICQ 更名 QQ 時的重要功能,于 2000 年加入。這就是騰訊對音視頻技術(shù)關(guān)注的起點,也是騰訊會議音視頻技術(shù)的源頭。
雖沒有直接涉及太多音視頻技術(shù)的研發(fā),但在將技術(shù)與產(chǎn)品整合, 帶來更好的用戶體驗方面有了不少積累。
這一狀況持續(xù)了 10 年,也是 QQ 用戶快速增長的 10 年。2010 年,QQ 同時在線用戶數(shù)突破一億,越來越多不同網(wǎng)絡(luò)場景、使用不同設(shè)備的用戶,開始使用音視頻通話功能。
只采購?fù)獠考夹g(shù),似乎行不通了:不僅出現(xiàn) bug 之后難以定位問題,用戶體驗也難以保證。騰訊需要自研技術(shù)成為大勢。
在 2011 年,在 QQ 同時在線用戶數(shù)達到一億四千萬之際,騰訊多媒體實驗室的前前身——音視頻中心成立,隸屬于 QQ 業(yè)務(wù)部門,主要為 QQ 產(chǎn)品提供音視頻技術(shù)支持。
很快,4G 通信技術(shù)進一步普及,音視頻技術(shù)成為移動互聯(lián)網(wǎng)爆發(fā)點,各種直播與視頻平臺層出不窮。
音視頻中心的技術(shù)的可用場景進一步擴大,在騰訊持續(xù)推動協(xié)同開放的環(huán)境下,其開放了自研的 SPEAR 音視頻引擎。
這時是 2015 年 11 月。
歷經(jīng) 4 年研發(fā),這一引擎已經(jīng)具備了流控策略控制云端化、通道智能化/多通道備份機制、跨平臺通信協(xié)議設(shè)計、雙人/多人通話平滑切換、通話客觀質(zhì)量評測體系等功能。
在當時已經(jīng)處于業(yè)界領(lǐng)先水平,為騰訊內(nèi)部相關(guān)業(yè)務(wù)方提供支撐,早已成為騰訊技術(shù)底座之一。
與此同時,這些技術(shù)也開始走向外部企業(yè),斗魚是第一批嘗鮮者,在 2015 年采用騰訊提供的直播連麥功能。
種種跡象,也暗示進一步的調(diào)整即將到來。
成立實驗室,對外輸出技術(shù)
2016 年,騰訊音視頻實驗室正式成立,人員增長 10 多倍,達到 80 多人,由湯道生直接領(lǐng)導(dǎo)。
技術(shù)對外的任務(wù)也進一步被明確:除了繼續(xù)為 QQ 提供音視頻技術(shù)支持,也要進一步將能力開放出來,在企業(yè)級市場上有所作為。
這波調(diào)整至今,已經(jīng) 3 年。
期間 2018 年 9 月 30 日,騰訊進行整體戰(zhàn)略升級,對架構(gòu)進行大調(diào)整,騰訊音視頻實驗室歸于 CSIG,面向企業(yè)級市場的任務(wù)進一步被明確強化。
現(xiàn)在的騰訊多媒體實驗室,依托騰訊云對外提供“騰訊會議”、“實時音視頻 TRTC”、“互動直播”、“游戲多媒體引擎 GME”四大解決方案。
在行業(yè)中的影響力越來越大,現(xiàn)在已經(jīng)拿下中國銀行、中國平安、新東方、VIPKID、斗魚、快手、西山居、完美世界等行業(yè)頭部客戶。
與此同時,2017 年 9 月,騰訊音視頻實驗室美國團隊成立。背后承載著湯道生給出的另一個任務(wù):出海和國際化,音視頻領(lǐng)域一定要做成國際標準。
團隊成員也頗為給力,騰訊也一舉成為國際音視頻編解碼標準制定的主要貢獻者之一。
2019 年,騰訊音視頻實驗室正式更名騰訊多媒體實驗室,團隊成員橫跨太平洋兩岸,達到 100 多人。
在他們的驅(qū)動下,騰訊多媒體實驗室的研究深度與廣度進一步增加,形成了國際標準研究與制定、實時音視頻傳輸、沉浸式新媒體、視頻編解碼、音頻處理、視頻處理、異構(gòu)平臺、音視頻通信質(zhì)量評估、智慧媒體等九大研發(fā)領(lǐng)域。
騰訊多媒體實驗室成長啟示錄
近年來,隨著人工智能等前沿技術(shù)的興起,不少公司都紛紛在企業(yè)內(nèi)部設(shè)立了實驗室,希望能夠提前布局,抓住紅利。
當前 AI 研究到技術(shù)落地,中間始終存在不小差距,而且研究往往投入大,對核心產(chǎn)品和主營業(yè)務(wù)見效又不會立竿見影。
因此不少實驗室也就出現(xiàn)了各種各樣的變動與困局。
騰訊多媒體實驗室從為一個產(chǎn)品提供技術(shù)支持,到為整個集團的技術(shù)底座,現(xiàn)在走向世界,在整個領(lǐng)域擁有話事權(quán)。
這也為如何在企業(yè)內(nèi)打造實驗室提供了一個參考:核心是技術(shù)研發(fā),但本質(zhì)是為業(yè)務(wù)服務(wù)。
騰訊多媒體實驗室,誕生于業(yè)務(wù)需求,騰訊 QQ 海量用戶之下,需要更加強有力的技術(shù)團隊提供支持。
這也就為騰訊多媒體實驗室的存在提供了必要條件,而且順應(yīng)通信技術(shù)發(fā)展,其也為騰訊在音視頻業(yè)務(wù)方向發(fā)力提供了不少技術(shù)支撐。
但它的發(fā)展并沒有止步于此,而是基于業(yè)務(wù)經(jīng)驗,形成了通用的解決方案,為整個集團的業(yè)務(wù)提供技術(shù)支撐。
這背后固然有企業(yè)發(fā)展戰(zhàn)略上的考慮,但實驗室在技術(shù)上的沉淀與研發(fā)也必不可少,因此在需求到來之時,才能夠乘勢而起。
這也是其積極參與國際標準制定的動機之一,得到更多的認可,才能在更大的經(jīng)濟體系中,證明自己的價值。
而現(xiàn)在,伴隨著騰訊向企業(yè)級市場發(fā)力,多媒體實驗室也通過騰訊云對外提供解決方案,并在內(nèi)部提供技術(shù)能力,孵化新的產(chǎn)品。
比如騰訊會議。
總結(jié)
以上是生活随笔為你收集整理的谁在驱动腾讯会议?腾讯旗下又一顶级实验室浮出水面的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人类对大脑多巴胺机制理解错了!顶级版Al
- 下一篇: 涨工资!特斯拉员工联名抗议:股价猛涨薪水