阿里安全图灵实验室再次刷新世界顶级算法比赛成绩
近日,阿里安全圖靈實(shí)驗(yàn)室(Alibaba Turing Lab)在Pascal VOC挑戰(zhàn)賽(Pattern Analysis, Statical Modeling and Computational Learning)的目標(biāo)檢測(Object Detection)之Competition 3 :TRAIN ON PASCAL VOC DATA項(xiàng)目中獲得了74.8分,刷新了該項(xiàng)檢測的世界最好成績。(成績查詢網(wǎng)址:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=3&submid=16634#KEY_ATLSSD)
據(jù)悉,PASCAL VOC挑戰(zhàn)賽是視覺對象的分類識別和檢測的一個(gè)基準(zhǔn)測試,提供了檢測算法和學(xué)習(xí)性能的標(biāo)準(zhǔn)圖像注釋數(shù)據(jù)集和標(biāo)準(zhǔn)的評估系統(tǒng)。在計(jì)算視覺領(lǐng)域,Pascal VOC挑戰(zhàn)賽類似于數(shù)學(xué)中的哥德巴赫猜想,與ImageNet和COCO(Common Objects in Context)同為世界頂級的比賽。
PASCAL VOC的圖片集包括20個(gè)目錄:人類,動物(鳥、貓、牛、狗、馬、羊),交通工具(飛機(jī)、自行車、船、公共汽車、小轎車、摩托車、火車),室內(nèi)(瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視)。其數(shù)據(jù)集圖像質(zhì)量好,標(biāo)注完備,非常適合用來測試算法性能,是深度學(xué)習(xí)圖像領(lǐng)域算法性能檢驗(yàn)的“標(biāo)準(zhǔn)”數(shù)據(jù)集。
阿里安全圖靈實(shí)驗(yàn)室研究人員表示,PASCAL VOC擁有全球最為權(quán)威、通用的數(shù)據(jù)集之一,同時(shí)也極具挑戰(zhàn)性。為此,他們研發(fā)了ATLSSD算法(Alibaba Turing Lab Single Shot Multibox Detection)。該算法基于one-shot的檢測框架SSD,兼顧模型性能和效率,并在多尺度特征抽取層增加了層間連接,類似FPN(Feature Pyramid Network)結(jié)構(gòu);在Extra Network增加了RFB(Receptive Field Block)結(jié)構(gòu),增加特征層對于不同尺度、不同形態(tài)目標(biāo)的表征能力;訓(xùn)練過程中模型利用Hard Negative Mining進(jìn)行模型預(yù)熱,然后利用Focal Loss進(jìn)行finetune,使得在有限的數(shù)據(jù)下,通過learning from scratch達(dá)到較好的訓(xùn)練效果。
目前,圖靈實(shí)驗(yàn)室的算法模型已廣泛應(yīng)用于阿里生態(tài)的淘寶、支付寶、優(yōu)酷、UC等核心業(yè)務(wù)線,比如商品中的違禁內(nèi)容、假貨和視頻的智能化防控等,并通過阿里云上的產(chǎn)品和解決方案(例如內(nèi)容安全、實(shí)人認(rèn)證等)為各企事業(yè)客戶提供優(yōu)質(zhì)的AI服務(wù)。
“為了讓算法更貼近業(yè)務(wù),解決更為實(shí)際的問題。我們曾經(jīng)推出過智能食堂項(xiàng)目,自主研發(fā)的刷菜圖像算法實(shí)現(xiàn)了菜品的智能識別和支付結(jié)算,并借助物聯(lián)網(wǎng)裝置,在云端記錄了用戶每日每餐的食物成分。”阿里安全圖靈實(shí)驗(yàn)室的研究人員表示,“我們在人工智能領(lǐng)域的研究為阿里經(jīng)濟(jì)體的智能化發(fā)展提供了強(qiáng)大的驅(qū)動力的同時(shí),也為數(shù)億用戶創(chuàng)造了極致的體驗(yàn)。”
據(jù)了解,圖靈實(shí)驗(yàn)室是阿里安全的頂級人工智能研發(fā)團(tuán)隊(duì),專注于計(jì)算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的技術(shù)研發(fā),已先后申請了50多項(xiàng)專利,并多次在國際權(quán)威評測中刷新世界紀(jì)錄(今年3月,在ICDAR2017 Competition on Multi-lingual scene text detection(MLT)自然場景多語言文本檢測競賽中就已經(jīng)刷新了世界最佳成績),其成員多為清華、北大、浙大、中科院等的博士或碩士。
總結(jié)
以上是生活随笔為你收集整理的阿里安全图灵实验室再次刷新世界顶级算法比赛成绩的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 综合练习:词频统计
- 下一篇: 老板,年终奖我不要了,请给我一部华为Ma