亚马逊高级应用科学家熊元骏:人类行为理解研究进展 | PhD Talk #19
人類行為理解(human action understanding)是計算視覺與視頻理解的重點領域之一。本次講座中,我們將回顧該領域近期的進展,包括方法,數據以及國際比賽的情況。接著將介紹香港中文大學多媒體實驗室在行為理解方面所做的系列工作。
首先我將介紹用于剪輯視頻分類的 Temporal Segment Network(TSN)方法。在該工作我們提出了對視頻內容進行稀疏采樣的新思路。
■?論文 | Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
■ 鏈接 | https://www.paperweekly.site/papers/1299
■ 代碼 | https://github.com/yjxiong/temporal-segment-networks
基于該思路,我們提出了用于時序動作檢測的 Structure Segment Network 方法。以及用于從未剪輯長視頻中學習行為理解模型的 UntrimmedNet 方法。
■?論文 | Temporal Action Detection with Structured Segment Networks
■ 鏈接 | https://www.paperweekly.site/papers/1298
■ 代碼 | https://github.com/yjxiong/action-detection
■?論文 | UntrimmedNets for Weakly Supervised Action Recognition and Detection
■ 鏈接 | https://www.paperweekly.site/papers/1300
■ 代碼 | https://github.com/wanglimin/UntrimmedNet
最后,我將介紹我們 AAAI 2018 的最新工作,基于圖卷積網絡(graph convolutional networks)和股價關鍵的行為識別方法 ST-GCN。
■?論文 | Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
■ 鏈接 | 尚未發布
■ 代碼 | https://github.com/yysijie/st-gcn
嘉賓介紹
熊元駿
亞馬遜高級應用科學家
熊元駿,2012 年畢業于清華大學自動化系,獲工學學士學位。2016 年畢業于香港中文大學信息工程系,獲信息工程博士學位。2016 年至 2017 年,任香港中文大學多媒體實驗室博士后研究員。現任美國亞馬遜公司高級應用科學家。
主要研究領域為計算機視覺,機器學習,視頻內容理解。在國際期刊及重要國際會議上發表論文多篇。攻讀博士期間獲香港政府博士獎學金全額資助。2016 年帶領團隊奪得首屆 ActivityNet 國際計算機視頻識別大賽冠軍。作為重要成員多次在 ImageNet 圖像識別大賽中名列前茅。
? ? ? ? ??
PhD Talk
?
人類行為理解的進展
亞馬遜高級應用科學家熊元駿
內容分享√在線Q&A√
活動形式:PPT直播
?
?活動時間?
12 月 10 日(周日)11:00-12:00
45 min 分享 + 15 min Q&A
長按識別二維碼,進入直播間
*或使用斗魚App搜索「1743775」
往期回顧
?
清華大學馮珺:基于強化學習的關系抽取和文本分類
基于雙語主題模型的跨語言層次分類體系匹配
東南大學高桓:知識圖譜表示學習
帶多分類判別器的GAN模型
多源信息表示學習在知識圖譜中的應用
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的亚马逊高级应用科学家熊元骏:人类行为理解研究进展 | PhD Talk #19的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于神经网络的实体识别和关系抽取联合学习
- 下一篇: 利用条件GANs的pix2pix进化版: