當前位置：首頁 > 运维知识 > windows >内容正文

windows

vtuber面部捕捉工具_泰国程序员开发VTuber形象生成系统，人人都能当虚拟偶像

發(fā)布時間：2025/4/16 windows 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 vtuber面部捕捉工具_泰国程序员开发VTuber形象生成系统，人人都能当虚拟偶像小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

ACG愛好者+程序員產(chǎn)生的無盡能量。

自從絆愛在2016年末發(fā)布了第一個視頻之后，這場名為虛擬偶像的大火就越燒越旺。

虛擬偶像被稱為vtuber，v是虛擬(virtual)的縮寫，而tuber則揭示了她們與正常人認知中偶像的區(qū)別：虛擬偶像主要的活動場所是在Youtube上，她們的頭像是虛擬的，身高體重等等人設都是虛擬的，只有背后的主播(又被稱為中之人)是真實的。

自稱“世界第一名虛擬主播”的絆愛

今天，在互聯(lián)網(wǎng)上活躍著成千上萬的虛擬偶像。她們有些隸屬于較大的企業(yè)，有專門的畫師負責制作人物的模型，發(fā)展比較好的還會有3D建模的支持；有些則隸屬于個人，很難得到3D模型，但是也得有具體的畫師在背后提供足以進行面部捕捉的人物立繪。

畫師，這個職業(yè)造就了虛擬偶像這個產(chǎn)業(yè)，也構成了“成為虛擬偶像”的基本門檻。即使早就有了Facerig這種簡易又方便的面部捕捉軟件，但是做一個能用的3D臉部模型對絕大多數(shù)沒有相關經(jīng)驗的人來說還是太過困難

Facerig標志性的小浣熊

但是面部捕捉的模型(即使只有個頭)并不簡單

即使在Vtuber行業(yè)發(fā)達的日本，同時掌握3D建模和角色設計的人才也不算多。這點反映在市場價格上就是：在網(wǎng)上一個能用的3D虛擬偶像模型出價近4萬人民幣，更多的個人Vtuber都選擇了簡單的2D圖像疊加，這樣人物只能做出簡單的動作，比如擺頭或者眨眼——就算這樣，也需要幾千元人民幣的維護費用。

2D圖像疊加而成的簡易Vtuber

帕魯克·昆古恩(Pramook Khungurn)是一位在谷歌地圖日本分部工作的軟件工程師(不過他本人是一位畢業(yè)于美國康奈爾大學的泰國人)。之前他主要研究的領域是計算機圖形學，還對算法和機器學習有所涉獵。而在所有這些個人簡歷性質(zhì)的描述之外，這位泰國程序員還是一位喜歡ACG文化的人。

昆古恩在一篇自我介紹網(wǎng)志中使用了長門有希作為封面圖片

一直以來，他把自己計算機圖形學上的能力運用到了對ACG的個人興趣上，比如參與到雙葉頻道對計算機系統(tǒng)的擬人化。最近，他(就像日本很多ACG愛好者一樣)迷上了虛擬偶像。這位程序員當然也不會畫畫，但他找到了別的方式來“成為偶像”。

昆古恩的工作成果

昆古恩將虛擬偶像的模型交給深度神經(jīng)網(wǎng)絡進行學習，讓AI學會了如何處理動漫人臉上的各個部分，就像上面那張圖一樣，通過調(diào)整“左眼”、“脖子”的參數(shù)，控制人臉的運動。他希望在此基礎上輸入任何一張人臉，都能做到如此自然地運動，就像下面這樣。

奧巴馬與彩虹社的Vtuber們

昆古恩的構想源于自動生成動漫人物的GAN圖庫以及衍生出的一系列動漫人物相關的圖片生成網(wǎng)絡。昆古恩覺得，既然深度學習的人工智能是未來動漫創(chuàng)作的重要工具，那么深度學習是不是也能幫助創(chuàng)建Vtuber內(nèi)容？

GAN自動生成動漫小姑娘的過程

昆古恩先從簡單的2D模型下手，他先是截下了彩虹社(一個虛擬偶像企業(yè))諸多vtuber做出不同姿勢(眨眼、轉頭)時的截圖，給定每種姿勢一個編號，導入到能自我學習的神經(jīng)網(wǎng)絡中去——先教會AI識別這些人物的不同姿勢。

絆愛的眨眼

在系統(tǒng)有了一定的辨別能力后，昆古恩將GAN圖庫中的8000個模型加以處理后導入到神經(jīng)網(wǎng)絡中。經(jīng)過處理，這些看起來各不相同的動漫人物頭像其實都可以被拆分成多個部分，用算法生成她們沒有被畫出來的諸多姿勢。

絆愛的側面拆解圖

當然，拆分動漫人物的各種部位也不簡單。昆古恩發(fā)現(xiàn)現(xiàn)在大部分成熟的圖像識別技術都是用于真人的，而動漫人物和真人有很大的區(qū)別——比如動漫人物的頭往往很奇怪，有夸張的頭發(fā)和夸張的尺寸。這一度成為一個嚴重的問題，昆古恩在博客里寫道：“最大的問題是，我不知道她們的頭到底在哪……”為此他專門創(chuàng)建了一個識頭工具，這個工具能排除頭發(fā)和帽子的干擾，準備判斷出人物的“頭骨”(也就是天靈蓋)。

最后，昆古恩完成了基本可用的“根據(jù)動漫圖自動生成Vtuber”學習網(wǎng)絡，這個網(wǎng)絡花了16小時分析了100萬張來源于GAN圖庫的圖片。現(xiàn)在，這個系統(tǒng)可以根據(jù)輸入的任何一張動漫圖片，來生成圖片中人物的諸多動作。使用者可以通過調(diào)整參數(shù)改變?nèi)宋锏谋砬?#xff0c;也可以直接導入到面部追蹤軟件中，讓軟件根據(jù)攝像頭捕捉到的真人表情自動調(diào)整參數(shù)。

昆古恩放出的可用模型

唯一令人遺憾的是，昆古恩還沒能將這套系統(tǒng)開源并把它放到網(wǎng)上。在論述研究過程的論文末尾，他提到，由于他和谷歌日本的合同，谷歌方面有權要求獲得這項系統(tǒng)的專利權，他正在嘗試通過內(nèi)部審查來將軟件、系統(tǒng)和神經(jīng)網(wǎng)絡數(shù)據(jù)的版權分配給自己。

希望有朝一日自己上傳圖片當虛擬偶像的朋友可以關注昆古恩的Github頁面，點擊閱讀原文可以跳轉。

我們始終歡迎喜歡內(nèi)容創(chuàng)作的小伙伴加入

應聘簡歷可發(fā)郵箱：hr@yystv.cn

文章投稿可發(fā)郵箱：tougao@yystv.cn

APP?| 你還可以回復"APP"，獲取下載地址

總結

以上是生活随笔為你收集整理的vtuber面部捕捉工具_泰国程序员开发VTuber形象生成系统，人人都能当虚拟偶像的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：怎么设置ppt页面的长度和宽度_在PPT
下一篇：自定义request_Spring Se

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

windows

vtuber面部捕捉工具_泰国程序员开发VTuber形象生成系统，人人都能当虚拟偶像

總結