用于改善质量、稳定性和多样性的可增长式GAN
用于改善質量、穩定性和多樣性的可增長式GAN
GANsNVIDIAFlyreal or fake ?
real or fake ?
1024 x 1024 images generated using the CELEBA-HQ dataset
來源
- 論文:Progressive Growing of GANs for Improved Quality, Stability, and Variation
- 鏈接:http://research.nvidia.com/publication/2017-10_Progressive-Growing-of
- 推薦理由: Under review as a conference paper at ICLR 2018
摘要
-
描述了生成對抗網絡的新的訓練方法
-
關鍵思想是通過漸進的方式訓練生成器和鑒別器:從低分辨率開始,逐步添加新的層次,從而在訓練進展中增加更精細的細節
-
還提出了一種增加生成圖像變化的簡單方法,并且在無監督的CIFAR10中實現了創記錄的8.80的初始分數。
-
此外,描述了幾個實現細節,這些細節對于抑制生成器和鑒別器之間的不健康競爭非常重要。
-
提出了一個新的衡量GAN結果的指標,無論是在圖像質量和變化方面。
-
作為額外的貢獻,構建了更高質量的CelebA數據集。
提出模型
模型圖
逐層遞增的網絡
以往的 GAN 生成低分辨率圖片穩定迅速,但生成高分辨率圖片困難重重。這篇文章從簡單的低分辨率圖片開始同時訓練生成器和判別器,然后逐層增加分辨率,讓訓練的難度每層只增加一點點。感覺就像是算法里面的暴力搜索到二分法搜索,大大提高了高分辨率圖片的生成速度及質量。
其他的一些改進
-
以往沒有好的辦法去判斷 GAN 生成的圖片是好是壞,很多時候需要肉眼來看,有很大的主觀性,而且人能檢查的樣本空間不夠大。文章的第 5 節介紹了如何用統計的方法來直觀的判斷生成樣本的好壞,采用的思路是在各個尺度上抽取 7x7 個像素的局域碎片,比較生成圖片與訓練圖片的局域結構相似性。
-
GAN 生成圖像的多樣性不好量化,當判別器過強時生成器可能會塌縮到單個類。這篇文章不添加任何超參數,只是將所有屬性在所有空間位置的統計標準差求平均,作為卷積神經網絡 Feature Map 的一個常量通道,就得到了更好的多樣性 。
-
使用了一種“local response normalization”方法來對 FeatureMap 做歸一化,不清楚與 BatchNormalization 的效果相比有沒有提升。
-
在 WGAN-GP 的正規化項中使用非常大的 gamma 因子,從公式上看當生成圖片與訓練圖片相差過大時,大的 gamma 因子可以讓生成分布快速漂移到訓練圖像分布。
算法結果
六分鐘的視頻
缺點以及不足
論文最后說了一下還面臨的一些情況:
與真實的寫實主義相比,還有一段路要走:
- 圖片語義敏感性和理解數據集的相關結束還有很大進步空間
- 圖像的微觀結構也有改進的余地
reference
http://mp.weixin.qq.com/s/1XkOEIlTD4Igr_Ws2sJvoQ
https://www.leiphone.com/news/201710/tPXkf1dcoGDqv5HD.html
http://research.nvidia.com/publication/2017-10_Progressive-Growing-of
轉載于:https://www.cnblogs.com/flyu6/p/8007329.html
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的用于改善质量、稳定性和多样性的可增长式GAN的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PHP 用图片输出验证码 无法正常显示
- 下一篇: 多边形面积