令人惊叹的8个深度学习应用「我去,这也能行!」
2016 年,圍棋程序 AlphaGo 擊敗人類頂尖選手,讓大眾了解到深度學習的概念。不僅如此,在計算機視覺和自然語言處理領域,深度學習已經有了廣泛而成熟的應用場景。人臉識別、自動駕駛、安全防范,都有深度學習的身影。語音識別、問答系統、機器翻譯,都是深度學習技術的模范實踐。
下面收集了一些深度學習的創意應用,希望能夠幫助大家開開腦洞,并感受下深度學習在生活中的應用潛力。當然也會提供了盡可能多的學習資料,讓各位學霸能夠享受盡情折磨自己,不斷進步的快感。
1.Photo Wake-Up
華盛頓大學的博士生 Chung-Yi Weng 和他的朋友們共同開發的一種新形式的 3D 角色動畫,他們將深度學習中的 Mask R-CNN(實例分割模型)與 SMPL 模板(一種參數化人體模型)模型相結合,讓圖像中的人物從圖片走進我們的現實中。
通過從 2D 圖像中剪切出主體,將其裝配到預先構建的骨架上,這樣就可以讓圖像中的主體進行一系列預定動作,如跑步、走路、跳躍。當與智能設備(例如智能手機或平板電腦)一起使用時,3D 動畫可以通過 2D 的照片或者圖畫“喚醒”并走向現實。
Photo Wake-Up 效果展示
資料推薦: [1] 論文參考:https://arxiv.org/abs/1812.02246?context=cs [2] 視頻資料:https://youtu.be/hs9K3eNkQOo (需科學上網)
2.Let there be color!
自動為黑白照片/視頻內容進行上色。該項目運用深度學習網絡學習自然存在于照片中的某些模式——比如,天通常是藍的,云是白的或者灰的,草是綠的。通過這類規則,完全不需要人為操作就能夠對照片進行重新上色。趕緊偷偷的告訴爺爺去,"家里的黑白老照片馬上就要變彩色了!“
為黑白照片自動上色
資料推薦: [1] GitHub:https://github.com/satoshiiizuka/siggraph2016_colorization[2] 論文參考:http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/data/colorization_sig2016.pdf (需科學上網) [3] 官方網站:http://iizuka.cs.tsukuba.ac.jp/projects/colorization/en/
3.LipNet
牛津大學和 Deepmind 的科學家共同完成了這一項目,通過“觀看”人類說話的視頻,以及輸入相應文字,對唇語的解讀準確率高達93.4%,遠超人類讀唇者52%的平均水平。對于聽力障礙的人來說這個簡直是福音。
資料推薦:[1] ?GitHub:https://github.com/bshillingford/LipNet[2] 論文參考:https://arxiv.org/pdf/1611.01599.pdf
4.Handwriting Generation
根據一些書寫筆跡,學習出筆的移動軌跡和文字之間的關系。然后生成一摸一樣的筆跡,并能過模仿多種筆跡。小朋友從此不再害怕老師要家長簽字了!
Handwriting Generation 效果展示
資料推薦:[1] 論文參考:https://arxiv.org/pdf/1308.0850v5.pdf[2] Demo展示:http://www.cs.toronto.edu/~graves/handwriting.html
5.Deep Dreaming
Google 的研究者找到了一種用深度學習來增強圖像特征的方法,隨后,他們就開發了 Deep Dreaming ——它能夠在圖片中生成一些不可思議的幻象。因為有些和夢境十分相似,因此取名 Deep Dreaming。具體生成什么樣的幻想與這個深度學習系統最近被暴露在什么樣的環境下有關,有時它甚至能生成嚇人的噩夢。
Deep Dreaming 效果展示
資料推薦:[1] 項目首頁:https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html[2] 影集:http://www.telegraph.co.uk/technology/google/11730050/deep-dream-best-images.html?frame=3370674[3]GitHub:https://github.com/google/deepdream
6.Pix2Pix
這個點子與之前提到的 Let there be color!有點類似,不過要更有創造力一點。你可以往電腦中輸入一幅簡筆畫,甚至一些色塊,然后讓電腦發揮自己的創造力輸出新的圖片。類似地,你也可以把衣服航拍照片變成一幅地圖,將白天的場景變成夜晚。
Pix2Pix 效果展示
資料推薦:[1] GitHub:https://github.com/phillipi/pix2pix[2] 論文參考:https://arxiv.org/pdf/1611.07004v1.pdf
7.DeepWarp
不管你手里拿到了誰的照片,用 Ganin 等人開發的這個深度學習網絡過一下,你就可以讓他的眼睛動起來:你可以讓他上下看、左右看,甚至繞著圈看...這么好用的表情包生產利器,趕緊收藏!
DeepWarp 效果展示
資料推薦:[1] Demo:http://163.172.78.19/[2] 參考論文:http://sites.skoltech.ru/compvision/projects/deepwarp/files/deepwarp_eccv2016.pdf[3] 官方網站:http://sites.skoltech.ru/compvision/projects/deepwarp/
8. Pixel Recursive Super Resolution
谷歌大腦的研究者們訓練了一個深度學習網絡,根據一些分辨率極低的人臉圖像來預測這些面孔真實的樣子。從此馬賽克什么的統統都走開!
消滅馬賽克
資料推薦: [1] 論文參考:https://arxiv.org/abs/1702.00783
看了這么多優秀有趣的深度學習應用,我唯一能肯定以及確定的就是這樣的項目對我來說還是太難了!自己什么技術水平,心里還是有點逼數的。
現在搞不定不代表以后搞不定,萬丈高樓平地起,還是要先從基礎的開始整!!!
實驗樓近期上線的《樓+之深度學習實戰第 1 期》9月3日正式開課,特別適合對深度學習有興趣,想要快速系統入門的朋友。
課程主要分為4個階段(6周內容):
1.課程準備階段:
Python 作為代碼實戰過程中的唯一編程語言,需要你熟悉 Python 的基礎語法,并掌握 NumPy,Pandas 及其他基礎工具模塊。
2.深度學習理論階段(1周):
圍繞深度學習基礎原理展開,內容將涵蓋線性回歸、邏輯回歸、感知機、人工神經網絡等算法的理論及應用。你會對深度學習的基本概念,以及模型的構建、訓練、評估有初步的了解,為后續深度神經網絡的學習打下基礎。
3.深度學習應用階段(3周):
涉及到應用和實踐。你將學習業界有著廣泛應用的深度學習開源框架,并進一步掌握不同深度神經網絡的原理和實際應用。
第一周:使用 Python 從 0 到 1 構建神經網絡。但深度神經網絡如果按此方法構建將會變得異常麻煩。本周,我們將學習深度學習通用的網絡構建方法,掌握業界最常用的兩大著名深度學習框架 TensorFlow 和 PyTorch。
第二周:將學習卷積神經網絡和生成對抗網絡的原理及構建方法。同時,課程將從圖像分類、圖像生成、目標檢測等場景出發,運用深度學習技術進行實踐。
第三周:學習循環神經網絡的原理和構建方法,嘗試探索自然語言處理相關應用。你不僅能接觸到機器寫詩的奇妙,還將學會利用最前沿的預訓練技術來完成假新聞分類任務。
4.深度學習工程階段(2周):
了解深度學習相關的工程實踐方法,包括前沿的自動化深度學習技術以及深度學習模型部署方法。最終,我們將通過項目挑戰比賽來檢驗課程的學習成果。
第一周:涉及到自動化深度學習技術,自動化深度學習可以一定程度上降低深度學習模型的開發門檻,算法的選擇、訓練、調優、部署等一系列過程都可以交給自動化組件來完成。與此同時,我們將掌握深度學習模型持久化方法,并獨立設計部署一個圖像分類云端模型推理 RESTful API。
第二周:我們依托于 Kaggle 建立了實戰化的比賽,你將體會到競爭帶來的樂趣。如果你能夠出色完成項目挑戰內容,將有機會獲得課程設置的現金獎學金。除此之外,認真完成項目挑戰的學員,也將收到課程組給出的評閱意見。
報名方式:請戳我直接報名,或添加助教小姐姐微信(sylmm002)進行咨詢/報名。
總結
以上是生活随笔為你收集整理的令人惊叹的8个深度学习应用「我去,这也能行!」的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android城市列表,首字母排序,右侧
- 下一篇: 渲染管线的基本流程