旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问
萬萬沒想到,我和小伙伴們被曠廠拿去「煉丹」了。
沒錯(cuò),就是這個(gè)煉丹爐!
站在爐子中央,各種算法代碼眼前飛閃,讓我體驗(yàn)了一把時(shí)空穿梭的快樂。
OMG!真·顱內(nèi)高潮...
業(yè)界認(rèn)為「煉丹」過程正如算法研究過程。
眾所周知,AI的三大支柱分別是數(shù)據(jù)、算法、算力。
那么在煉丹過程中,數(shù)據(jù)便是金木水火土等自然元素,算法框架是用來煉丹的爐子,算力就是煉丹爐下的三昧真火。
元素全不全,爐子好不好,火旺不旺決定了AI開發(fā)者能不能練出一顆AI的「靈丹妙藥」。
從2014年至今,中國新一代煉丹宗師曠視經(jīng)過多年的磨練打磨,打造了「煉丹房」—— Brain++。
MegEngine(深度學(xué)習(xí)框架天元)是丹爐,MegData(數(shù)據(jù)管理平臺(tái))是元素,MegCompute(深度學(xué)習(xí)云計(jì)算平臺(tái))便是那三昧真火。
這次,「煉丹房」 Brain++ 迎來了全新升級(jí)!
升級(jí)后的煉丹房,「自動(dòng)」成為最大特色,煉丹師們不再需要經(jīng)過九九八十一天這么漫長的時(shí)間來煉制丹藥。
這個(gè)平臺(tái)提供了怎樣的最新功能,讓AI開發(fā)者們更輕便地生產(chǎn)算法?
Brain++「神助攻」:一個(gè)「旗幟檢測」算法誕生
熟悉曠視的人都應(yīng)該知道,Brain++ 是曠視在AI領(lǐng)域創(chuàng)業(yè)多年的致勝法寶。
它將算法、算力和數(shù)據(jù)能力集為一體,核心能力包括:
數(shù)據(jù)的處理、清洗和管理能力,算力的共享、調(diào)度和分布式能力,算法的訓(xùn)練、推理及部署能力。
全面覆蓋了從 AI 生產(chǎn)(輸出算法模型)到應(yīng)用(實(shí)現(xiàn)算法工程化封裝)各環(huán)節(jié)。
因此,Brain++被內(nèi)部定義為「AI生產(chǎn)力平臺(tái)」。
但時(shí)局變了,數(shù)據(jù)滿溢,算力飛升,算法無處不在。許多開發(fā)者們真正面臨的挑戰(zhàn)是:如何讓算法生產(chǎn)更加高效?
要知道,算法生產(chǎn)能力決定算法價(jià)值上限。
當(dāng)前的算法生產(chǎn)不僅僅是模型的訓(xùn)練,還包括需求分析、數(shù)據(jù)處理、上線部署、落地應(yīng)用4個(gè)環(huán)節(jié)。
過程標(biāo)準(zhǔn)化是影響算法生產(chǎn)的關(guān)鍵要素,只有過程標(biāo)準(zhǔn)化才能實(shí)現(xiàn)算法生產(chǎn)的自動(dòng)化。
讓算法生產(chǎn)邁向自動(dòng)化時(shí)代,便是Brain++迎接這一挑戰(zhàn)的底氣!
自動(dòng)化的數(shù)據(jù)管理和質(zhì)檢——自動(dòng)推薦合適的訓(xùn)練算法和模型——自動(dòng)檢查算法準(zhǔn)確率并給出優(yōu)化建議便是升級(jí)后Brain++的最新功能。
舉個(gè)真實(shí)場景中的例子,
在鋼鐵冶煉廠中,存在一些比較危險(xiǎn)的設(shè)備。根據(jù)生產(chǎn)安全的要求,這些設(shè)備周圍需要插小紅旗來做警示和標(biāo)志。
如何能夠檢測出小紅旗是否還插著?
這就需要做一個(gè)紅旗檢測的模型,通過安裝的攝像頭來進(jìn)行自動(dòng)化檢查。
需求明確后就需要進(jìn)行算法生產(chǎn)了。
首先,Brain++提供自動(dòng)化的數(shù)據(jù)管理和質(zhì)檢,包含十余種質(zhì)檢策略,這個(gè)過程中可以排除無意義的數(shù)據(jù)。
下面這2個(gè)紅旗就是通過自動(dòng)化平臺(tái)所發(fā)現(xiàn),圖片的畫風(fēng)其實(shí)和我們真實(shí)場景中的差別非常大,就屬于一些無效數(shù)據(jù),或者說噪音數(shù)據(jù)。
平臺(tái)自動(dòng)檢測出后,就會(huì)在訓(xùn)練模型前幫你剔除。
然后便開始模型自動(dòng)化訓(xùn)練,平臺(tái)會(huì)根據(jù)部署資源的要求,為開發(fā)者自動(dòng)推薦最合適的訓(xùn)練算法和策略。
這一環(huán)節(jié)中,就不需要開發(fā)者自己去學(xué)習(xí)到底應(yīng)該怎樣去選擇算法或者調(diào)優(yōu)模型。
接下來便是算法調(diào)優(yōu)分析,Brain++集成十余大類不同的結(jié)果分析和對(duì)應(yīng)的調(diào)優(yōu)策略,比如漏檢/誤檢結(jié)果呈現(xiàn)。
當(dāng)紅旗檢測模型訓(xùn)練完成后,將其放到實(shí)際應(yīng)用場景中測試,黃色框就是一次訓(xùn)練后的算法檢測出來紅旗的位置。
說明這一算法存在明顯誤檢問題,特別可能在這樣的一個(gè)場景誤檢率比較高,AI生產(chǎn)力平臺(tái)便可幫助開發(fā)者自動(dòng)發(fā)現(xiàn)問題,并給出針對(duì)性優(yōu)化建議。
總的來看,當(dāng)我們分析完想要做一個(gè)旗幟的檢測需求之后,首先需要2個(gè)小時(shí)來做一個(gè)圖像的質(zhì)檢和旗幟的標(biāo)注,之后選擇一個(gè)GPU的訓(xùn)練環(huán)境,模型訓(xùn)練的時(shí)間大概花費(fèi)一個(gè)小時(shí)左右的時(shí)間。
在上線部署后,根據(jù)剛剛提到的分析和調(diào)優(yōu)策略,研究人員進(jìn)行了2輪左右的迭代,一個(gè)「旗幟檢測」算法就誕生了!
你所感受到的便捷,是曠視通過總結(jié)過去10年算法生產(chǎn)落地的海量經(jīng)驗(yàn),探索出一套「快速、低成本生產(chǎn)算法」的模式,并將其沉淀在Brain++。
這十年,曠視AI創(chuàng)新走過怎樣一個(gè)歷程?
7月16日,由曠視首席科學(xué)家、研究院院長孫劍領(lǐng)銜的技術(shù)團(tuán)隊(duì)在2021曠視技術(shù)開放日(MegTech 2021)上分享了曠視十年來在AI技術(shù)上的實(shí)踐和思考。
十年實(shí)踐,首席科學(xué)家孫劍發(fā)AI「靈魂」三問
今年,是曠視成立的第十年。
我們來聊一聊曠視這十年的進(jìn)階之路。
首席科學(xué)家孫劍以曠視為例,總結(jié)了過去十年中國AI技術(shù)價(jià)值的發(fā)展歷程。
2011年前后,AI發(fā)展的重點(diǎn)是基礎(chǔ)科研。基礎(chǔ)科研的關(guān)鍵點(diǎn)是突破單點(diǎn)算法,讓AI率先在互聯(lián)網(wǎng)等數(shù)字化程度高等領(lǐng)域應(yīng)用落地,變得真正可用。
2015年起,AI需求越來越多,AI商業(yè)化落地也越來越多。這個(gè)過程中,算法在不斷拓展應(yīng)用的邊界,從算法到軟硬結(jié)合,AI創(chuàng)造的價(jià)值越來越大。
從2020年開始,AI成為新基建的重要部分,持續(xù)降低算法門檻,讓AI生產(chǎn)變得更加容易,基礎(chǔ)設(shè)施需要AI普惠化。
AI有沒有用?AI在哪里用?AI易不易用?
這是AI行業(yè)的「靈魂」三問,是所有AI企業(yè)需要回答的問題。
孫劍認(rèn)為,AI有沒有用歸根到底是看AI基礎(chǔ)科研有沒有突破。
基礎(chǔ)科研是AI創(chuàng)新突破的基石,需要長期主義的堅(jiān)持。
對(duì)曠視來說,要構(gòu)建科學(xué)價(jià)值和產(chǎn)業(yè)價(jià)值統(tǒng)一的基礎(chǔ)科研體系。
十年來,曠視不斷突破創(chuàng)新:
在學(xué)術(shù)上發(fā)表85篇頂級(jí)會(huì)議論文,在競賽上斬獲40項(xiàng)冠軍,在實(shí)用上研發(fā)了包括ShuffleNets系列在內(nèi)的眾多基礎(chǔ)模型,已經(jīng)廣泛應(yīng)用在手機(jī)等智能設(shè)備上,推動(dòng)軟硬協(xié)同發(fā)展。
基礎(chǔ)科研有了,落地才是科研的價(jià)值,這就需要解決「AI在哪里用」的問題。
對(duì)于曠視,一直瞄準(zhǔn)的是消費(fèi)物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)和供應(yīng)鏈物聯(lián)網(wǎng)三大場景。
AI是核心能力,IoT是落地場景,在數(shù)字世界與物理世界融合的智能化時(shí)代,AI算法正在為產(chǎn)品帶來更多的價(jià)值提升。
曠視認(rèn)為,「算法不只讓很多產(chǎn)品從好變更好,更能讓產(chǎn)品從不可能變可能。」
在曠視十年的AI實(shí)踐落地中發(fā)現(xiàn),算法已不再僅僅是「軟件物料」,而是成為「核心組件」。
從科研到落地,算法正在創(chuàng)造越來越大的價(jià)值,也在開始重新定義軟硬件。
曠視研究員范浩強(qiáng)在MegTech 2021上的分享
AI落地是我們所有人都在講的問題,但是當(dāng)前,大量算法生產(chǎn)過程還是非標(biāo)準(zhǔn)化。因?yàn)榉菢?biāo)準(zhǔn)化所以算法生產(chǎn)過程充滿不確定性。
曠視認(rèn)為,落地實(shí)用是檢驗(yàn)算法的最高標(biāo)準(zhǔn)之一,而生產(chǎn)落地實(shí)用算法的過程「只有先標(biāo)準(zhǔn)化才能自動(dòng)化」,才能更進(jìn)一步實(shí)現(xiàn)規(guī)模化的普惠易用。
從2014年至今,持續(xù)打磨升級(jí)的AI生產(chǎn)力平臺(tái)Brain++,就是曠視推動(dòng)算法生產(chǎn)邁向自動(dòng)化時(shí)代的AI基礎(chǔ)設(shè)施。
為什么是曠視?
不是煉丹「上癮」,是AI進(jìn)化
曠視是一家靠算法起家的公司。
準(zhǔn)確來說,可以細(xì)分為兩類:
一類是以深度學(xué)習(xí)(DL)和計(jì)算機(jī)視覺(CV)為基礎(chǔ)的核心算法。
另一類則是行業(yè)算法 (或者稱AIoT算法)。
曠視的算法之路,經(jīng)歷了從核心算法突破,到行業(yè)算法落地和創(chuàng)新,再到算法生產(chǎn)平臺(tái)的拓展過程。
MegTech 2021上,曠視展示了其算法量產(chǎn)星空?qǐng)D。
算法量產(chǎn)不是一個(gè)單一產(chǎn)品,更不是「上癮」,而是一種生產(chǎn)模式的理念革新和生產(chǎn)力進(jìn)化。
曠視現(xiàn)場通過一系列技術(shù)Demo演示,系統(tǒng)展示了其最新的技術(shù)成果。
曠視研究院推出了面向服務(wù)器和下一代AI芯片的通用模型RepVGG,其在開源后Github star已超過1800。
還推出全景視頻實(shí)時(shí)拼接算法。
全景視頻拼接的實(shí)現(xiàn),需要多個(gè)攝像頭在同一場景下采集不同方向視頻,然后逐幀地將各個(gè)方向的視頻幀拼接起來,最終得到360度全景視頻,甚至360度*180度的球面全景視頻。
其核心是運(yùn)用基于光流的多攝AI拼接算法,同時(shí)依靠實(shí)時(shí)動(dòng)態(tài)無縫拼接網(wǎng)絡(luò)模型,解決了多攝拼接計(jì)算量大、拼縫明顯,以及拼接無法動(dòng)態(tài)更新的技術(shù)難題。
還有單目3D車路感知:僅用單目可見光相機(jī),就可以實(shí)現(xiàn)車路信息的3D感知。
曠視MegTech 2021上還展示了,目前性能最強(qiáng)的端到端實(shí)時(shí)全卷積全景分割算法,以及挑戰(zhàn)經(jīng)典,目標(biāo)檢測架構(gòu)創(chuàng)新的YOLOF。
從基礎(chǔ)科研,到行業(yè)落地,再到基礎(chǔ)設(shè)施,這是人工智能技術(shù)價(jià)值躍遷的三個(gè)關(guān)鍵。
曠視正是沿著這樣的路線在不斷創(chuàng)新,務(wù)實(shí)落地。預(yù)研一代、孵化一代、交付一代,這是曠視技術(shù)創(chuàng)新研發(fā)模式。
在技術(shù)開放日現(xiàn)場,曠視將這一套創(chuàng)新研發(fā)模式首次對(duì)外完整的呈現(xiàn)出來。
孫劍總結(jié)道,「聚焦最優(yōu)秀的人才,一起做最好的科研,通過產(chǎn)品讓科研成果創(chuàng)造價(jià)值,不斷探索新領(lǐng)域,這是曠視的秘訣,也是AI技術(shù)價(jià)值躍遷的秘訣。」
對(duì)了,忘了告訴你,這是一個(gè)北京新晉AI網(wǎng)紅打卡圣地。
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue使用query传参页面刷新数据丢失
- 下一篇: 为了让AI不断打怪升级,DeepMind