OPPO斩获全球计算机视觉顶级会议CVPR 2020两项第一
PingWest 品玩 6 月 17 日訊。在今年的全球計(jì)算機(jī)視覺頂級會(huì)議 CVPR(Conference on Computer Vision and Pattern Recognition 國際計(jì)算機(jī)視覺與模式識別會(huì)議)上,OPPO 獲得兩項(xiàng)第一名、兩項(xiàng)第三名。
OPPO 獲得第一名的技術(shù)成果為將模糊圖片”算“清晰的“極端超級分辨率感知”技術(shù);此外,通過照片計(jì)算拍照方位的"手持設(shè)備視覺定位"技術(shù)則獲得第三名和分項(xiàng)第一;通過讀取錄像智能識別其中人類行為的“長視頻行為識別”技術(shù),同時(shí)獲得第三名。
除 OPPO 研究院智能感知與交互研究部之外,OPPO 美國研究所也在 CVPR 上展露風(fēng)采,取得“真實(shí)世界超分辨率圖像處理技術(shù)”(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成績,OPPO 美研所時(shí)空實(shí)驗(yàn)室主管孟子博在 CVPR 做了暗光影像技術(shù)演講“穿透黑暗:從圖像到視頻”(Looking into the dark: from image to video), 美研所 AI 計(jì)算機(jī)視覺高級技術(shù)總監(jiān)全書學(xué)做了“從零開始構(gòu)建可在智能手機(jī)和 AR 眼鏡上運(yùn)行的統(tǒng)一 SLAM 系統(tǒng)”演講(Building a unified SLAM system running on both smartphone and AR glass from scratch)。
“極端超分辨率感知”( Perceptual Extreme Super-Resolution)是 CVPR 難度最高的賽項(xiàng)之一,要求從模糊的低分辨率圖片中,獲得細(xì)節(jié)更清晰、更接近真實(shí)情況的高清圖像。這是計(jì)算機(jī)視覺技術(shù)中難度最大的領(lǐng)域之一,需要盡可能地平衡圖像的畫質(zhì)與真實(shí)性。針對這項(xiàng)挑戰(zhàn),OPPO 提出了獨(dú)創(chuàng)的神經(jīng)網(wǎng)絡(luò)架構(gòu) RFB-ESRGAN,通過更智能的方式提取原圖特征,用分布式算法提高計(jì)算效率,以更多元的采樣與計(jì)算模型配合,通過計(jì)算把模糊的圖片清晰放大了 16 倍,從全球 280 多個(gè)頂尖參賽團(tuán)隊(duì)中脫穎而出,獲得了第一名,其他參賽者,不乏來自臉書、百度、微軟、亞馬遜、中科院、UIUC 等國際頂尖科技公司與院校的團(tuán)隊(duì)。
OPPO 極端超分辨率感知處理效果,最左側(cè)圖片紅框內(nèi)為原圖,最右側(cè)為最終結(jié)果
這項(xiàng)技術(shù)將在未來為諸多應(yīng)用場景提供幫助,例如將用戶手機(jī)拍攝到的模糊影像處理成細(xì)節(jié)豐富的高清效果,修復(fù)圖像受到損壞的老照片、老電影,或者對衛(wèi)星、航天圖像進(jìn)行細(xì)節(jié)分析等工作。
人工智能程序?qū)D片從多維度進(jìn)行分析
在“手持設(shè)備視覺定位”挑戰(zhàn)(Visual localization for handheld devices challenge)中,OPPO 獲得了面向室外場景的數(shù)據(jù)集(Aachen Day-Night)第一名,與面向室內(nèi)場景的數(shù)據(jù)集(InLoc)第三名。“視覺定位”是通過搜集和分析圖像中的海量信息,對自身拍攝方位作出精確判斷。這一技術(shù)對未來的 AR 眼鏡,智能機(jī)器人,精準(zhǔn)導(dǎo)航等應(yīng)用都能起到重要作用。例如,當(dāng)智能機(jī)器人助手安裝了攝像頭之后,就可以利用視覺定位技術(shù)對拍攝到的圖像作運(yùn)算分析,獲得準(zhǔn)確定位,從而精準(zhǔn)的移動(dòng)。
此外,OPPO 還在“長視頻行為識別”(Activity detection in extended videos)賽項(xiàng)中獲得了第三名。“視頻行為識別”是指在某段視頻中分析并判斷人或物體對象的行為動(dòng)作。OPPO 的智能程序可高效識別并重組每一幀畫面中的人物,辨別復(fù)雜動(dòng)態(tài)視頻中的人類行為。在一段數(shù)十人出鏡的長視頻中,它準(zhǔn)確識別了視頻中每個(gè)人走動(dòng)或是聊天等的數(shù)十種動(dòng)作。這項(xiàng)技術(shù)在未來能廣泛應(yīng)用在人機(jī)交互、運(yùn)動(dòng)分析等領(lǐng)域,例如未來的手機(jī)產(chǎn)品便可以自動(dòng)識別正在運(yùn)動(dòng)的拍攝對象,并自動(dòng)調(diào)節(jié)快門對焦。
2020 年初,OPPO 研究院正式成立智能感知與交互研究部,邀請行業(yè)領(lǐng)軍人物郭彥東博士加盟并擔(dān)任 OPPO 智能感知首席科學(xué)家,領(lǐng)導(dǎo)快速組建并逐步完善專業(yè)科研團(tuán)隊(duì)。目前,智能感知與交互研究部已初具規(guī)模。此次 OPPO 參加 CVPR 2020 的多項(xiàng)獲獎(jiǎng)成果均來自該團(tuán)隊(duì)。
總結(jié)
以上是生活随笔為你收集整理的OPPO斩获全球计算机视觉顶级会议CVPR 2020两项第一的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 求一个qq伤感网名男生带符号。
- 下一篇: 浅表性胃炎的症状可以喝酒吗(浅表性胃炎的