【赠书】新手速递!深度学习视频理解!
??
視頻理解是當前計算機視覺研究領(lǐng)域中備受學術(shù)界和工業(yè)界關(guān)注的方向,隨著視頻行業(yè)的高速發(fā)展,如何利用 AI 技術(shù)更好地對視頻內(nèi)容進行理解變得越來越重要。今天要給大家介紹的書是《深度學習視頻理解》。
本書內(nèi)容
本書對視頻理解的3個重要領(lǐng)域進行介紹,對于每個領(lǐng)域,本書不僅解釋了相關(guān)算法的原理,還梳理了算法演進的脈絡(luò)。
全書共分6章。
第1章:緒論,簡要介紹視頻行業(yè)的發(fā)展歷程,動作識別,時序動作定位,視頻Embedding技術(shù)。
第2章:經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)回顧,回顧經(jīng)典圖像分類模型和RNN。
第3章,基于2D卷積的動作識別,包括基本的平均匯合法,RNN模型,雙流法,時序稀疏采樣。
第4章:基于3D卷積的動作識別,包括基本模型C3D,雙流Infalted 3D模型,3D卷積的低秩近似,時序位移模型TSM等。
第5章:時序動作定位,介紹時序動作檢測相關(guān)的重要算法,包括基于滑動窗的方法,基于候選時序區(qū)間的算法,自底向上與時序結(jié)構(gòu)信息建模的方法等。
第6章:視頻Embedding,介紹視頻Embedding另一的重要算法,包括Word2Vec,Item2Vec等。
附錄:總結(jié)了常用的一些視頻處理工具,包括FFmpeg,OpenCV,Decord,Lintel。
本書作者張皓,畢業(yè)于南京大學計算機系周志華教授領(lǐng)導的機器學習與數(shù)據(jù)挖掘研究所(LAMDA),導師為吳建鑫教授,研究方向為深度學習和計算機視覺,曾獲國家獎學金、江蘇省三好學生等榮譽
本書是一本綜合介紹新的基于深度學習的視頻理解算法的參考書,通過理論與實踐相結(jié)合的形式詳細介紹了視頻理解中的識別、定位、特征表示等諸多重點任務(wù)和方法。對該領(lǐng)域的研究者和從業(yè)者都非常實用。
贈書
接下來是福利時間,本次我們贈送出3本書籍(前3次獲得贈書的朋友不能再參與本次贈書活動),想要獲得書籍的同學,在本公眾號下方留言,根據(jù)點贊數(shù)的高低,11月9日晚上22:00統(tǒng)計出獲獎讀者并進行公示,屆時聯(lián)系有三微信Longlongtogo即可。
如果沒有獲得贈書,也可以在京東和當當購買,鏈接如下:
往期相關(guān)
【CV夏季劃】2021年有三AI-CV夏季劃出爐,沖刺秋招,從CV基礎(chǔ)到模型優(yōu)化徹底掌握
【CV秋季劃】生成對抗網(wǎng)絡(luò)GAN有哪些研究和應(yīng)用,如何循序漸進地學習好?
【CV秋季劃】模型優(yōu)化很重要,如何循序漸進地學習好?
【CV秋季劃】人臉算法那么多,如何循序漸進地學習好?
【CV秋季劃】圖像質(zhì)量提升與編輯有哪些研究和應(yīng)用,如何循序漸進地學習好?
總結(jié)
以上是生活随笔為你收集整理的【赠书】新手速递!深度学习视频理解!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【特惠】非饱和(不内卷),高颜值,有三这
- 下一篇: 【GPU推荐】高性价比GPU平台,309