攝影/寧穎
(資料圖)
虛擬人形象栩栩如生,固然離不開個體工作者的細微設(shè)計,但更在于技術(shù)領(lǐng)域的突破。外表宛若鄰家小妹的李星瀾,成就TA的是幾乎當前市面上最極致的超寫實技術(shù)。
近年來,“造人”成為業(yè)界高度關(guān)注的話題,虛擬人似乎已經(jīng)準備好在未來世界閃耀光芒。
2012年,洛天依以中文虛擬歌手的身份正式出道。隨后,登上各大衛(wèi)視,與明星同臺演唱。2021年春晚舞臺與2022年北京冬奧會文化節(jié)開幕式上也出現(xiàn)了她的身影。2021年,AYAYI作為虛擬寫真人物,首次出現(xiàn)在小紅書上。如今,AYAYI已經(jīng)和嬌蘭、保時捷等品牌達成合作,并作為“數(shù)字員工”入駐了阿里。此外,除了獨立的虛擬人物,甚至已經(jīng)有了虛擬女團。A-Soul是樂華娛樂旗下虛擬偶像女團,共由5名成員組成,出道三年來,吸引了不少目光。
虛擬人正踩著人類的腳印前行。行業(yè)報告顯示,到2030年我國虛擬數(shù)字人整體市場規(guī)模將達到2700億元。其中,“身份型虛擬人”市場規(guī)模預(yù)計達到1750億元,占主導(dǎo)地位,而“服務(wù)型虛擬人”總規(guī)模也將超過950億元。得益于AI、VR、AR等技術(shù)的發(fā)展,虛擬人的應(yīng)用場景正在從傳統(tǒng)的虛擬偶像等娛樂行業(yè)邁向更多元化的領(lǐng)域。
“十四五”規(guī)劃綱要將虛擬現(xiàn)實技術(shù)列入數(shù)字經(jīng)濟重點產(chǎn)業(yè),并給出明確發(fā)展方向,加速虛擬人的場景化應(yīng)用落地。新業(yè)態(tài)、新體驗的背后,是無數(shù)代碼、動畫、程序,以及運營推廣。人們不禁發(fā)問,創(chuàng)造虛擬人到底需要什么樣的技術(shù)?一個AI驅(qū)動的虛擬人,能有什么樣的產(chǎn)業(yè)價值?“造人”產(chǎn)業(yè)路在何方?
數(shù)百項細化指標成就好“皮囊”
“態(tài)濃意遠淑且真,肌理細膩骨肉勻?!币活^俏麗的黑發(fā)落在肩上,頭發(fā)的紋路清晰可見。兩只大眼之間是挺拔的鼻梁,而你甚至可以在她棕色的瞳孔中看到小一號的自己。說話時,喉嚨與肌膚的顫動呈現(xiàn)出更細微的表情變化與皮膚紋理。我們仿佛能體會到氣流從肺部上升的整個過程。這是李星瀾,不是真人,而是科幻游戲《星球:重啟》中的NPC。李星瀾不是簡單的游戲NPC,根據(jù)開發(fā)團隊MMC工作室介紹,李星瀾是他們的首位元宇宙虛擬人。除了在游戲中引導(dǎo)玩家之外,TA還在游戲外發(fā)抖音、接代言、做主持人。去年12月底,在第十三屆華語科幻星云獎的頒獎典禮上,李星瀾從科幻作家劉慈欣手上接過了最佳科幻游戲創(chuàng)意獎獎杯。
細膩的肌理與生動的微表情是李星瀾的一大特色,這也符合如今大眾對于虛擬人的印象——一個個越來越漂亮、越來越接近于真人的3D人物模型。但“好皮囊”背后卻沒那么簡單。不少人或許都有過游戲“捏臉”的經(jīng)歷,成百上千的數(shù)據(jù)與固定表情已經(jīng)令不少玩家叫苦不迭,而虛擬人的動態(tài)微表情與及時互動更為復(fù)雜。
不同于早在十年前流行的網(wǎng)絡(luò)游戲中的“捏臉”,為虛擬人“捏臉”實際上是一場動靜之間的博弈。隨著技術(shù)更新、元宇宙概念的火熱,人們對捏臉師的要求越來越高,促使其有了更細化的分支,新職業(yè)“虛擬數(shù)字人捏臉師”隨之誕生。他們站在虛擬與現(xiàn)實之間,用數(shù)據(jù)、代碼以及諸多設(shè)計元素為虛擬人創(chuàng)造形象。有人將他們稱為虛擬世界的“女媧”。
打開三維建模軟件,一個靜態(tài)立體的人臉模型清晰地呈現(xiàn)在左側(cè)的顯示界面上。“如果想要它動起來,就需要將每個點位都變成可編輯的狀態(tài)?!闭f著,王雨便開始點擊右側(cè)的操作界面。鼠標鍵盤一頓工作后,顯示界面中頭發(fā)、額頭、眉毛、眼睛、耳朵、鼻子、嘴巴所對應(yīng)的每個區(qū)域都被放大拆解,成為可供操作的內(nèi)容。王雨是專職的虛擬人捏臉師,本就是學(xué)設(shè)計的他,在元宇宙概念興起時,轉(zhuǎn)行到了數(shù)字虛擬人領(lǐng)域。據(jù)王雨介紹,捏臉最重要的是細節(jié)。從眉毛的彎度到嘴唇的曲線甚至每一塊肌肉的緊實程度,都是需要考慮的地方。而最為復(fù)雜的部位則是眼睛。“讓虛擬人擁有類人外觀,眼睛是最大的功臣。”從內(nèi)外眼角到上下眼皮,再到瞳孔晶狀體,近30個維度的精細拆解,使得眼睛能被 “捏”成任意的類型,以匹配不同的人臉特征。除此之外,調(diào)節(jié)數(shù)字人細微參數(shù),以及所處位置的燈光、環(huán)境等背景元素是王雨避免“恐怖谷效應(yīng)”的妙訣。所謂恐怖谷效應(yīng),是當機器人的外形與人非常接近的時候,人們產(chǎn)生的一種心理恐懼的效應(yīng)。這也是許多人看到一些虛擬人時感到不適的原因。
虛擬人形象栩栩如生,固然離不開個體工作者的細微設(shè)計,但更在于技術(shù)領(lǐng)域的突破。外表宛若鄰家小妹的李星瀾,成就TA的是幾乎當前市面上最極致的超寫實技術(shù)。據(jù)悉,李星瀾的一大技術(shù)核心是數(shù)字人面部基表情制作和自動化綁定?;砬槭侵该娌勘砬榫幋a系統(tǒng)會有一系列基礎(chǔ)表情,通過這些基表情組合就可以滿足各種不同的表情表現(xiàn)需求。自動化綁定則極大提高了整個虛擬人生成表情的效率,無需人工手動添加。MMC團隊利用人臉掃描和美術(shù)刻畫為李星瀾制作出70多個基表情,是大部分其他虛擬人的一倍以上。此外,NVIDIA相關(guān)技術(shù)也在協(xié)作和渲染方面提供了許多便利,NVIDIA Omniverse可以實時渲染出高保真、物理級精確的結(jié)果,相比過去影視制作中動輒幾十數(shù)百小時的渲染時間大大縮短。
“中之人”與AI,虛擬人的內(nèi)核
相較于靜態(tài)的外在形象,對于虛擬人而言,更為重要的是動態(tài)管理。和動畫作品的底層邏輯一樣,能真實動起來的虛擬人,才是合格的虛擬人。許多動畫專業(yè)學(xué)生制作的動畫人物靜止時形象都比較好,一旦動起來就手腳脫節(jié)、圖層沖突,完全變了模樣。而虛擬人對動態(tài)真實的要求更為嚴格,動畫作品中一系列夸張?zhí)幚硗耆贿m用。
根據(jù)內(nèi)核及處理方式的不同,虛擬人有兩大分類:一是廣義虛擬人,指通過CG建模、中之人(虛擬形象扮演者)聯(lián)合動捕驅(qū)動技術(shù)打造出的虛擬人。二是超級自然虛擬人,其核心為通過AI技術(shù)“一站式”完成虛擬人制作與運營全過程,并具備感知、表達、交互能力?,F(xiàn)存市場中前者較多,典型的是A-Soul虛擬女團,后者是行業(yè)發(fā)展趨勢,典型如微軟小冰。
由中之人驅(qū)動的虛擬人,依靠對真人的深度采集完成,包括動作捕捉、面部表情捕捉、音視頻合成等,再綁定到虛擬人上。由AI驅(qū)動的虛擬人則利用了深度學(xué)習(xí)、小樣本學(xué)習(xí)、自然語言處理、神經(jīng)網(wǎng)絡(luò)渲染等技術(shù)手段,比如輸入演講稿或者語音,AI模型就能自動輸出肢體動作、面部表情、聲音。
據(jù)業(yè)內(nèi)人士介紹,動作捕捉設(shè)備主要涉及全身、面部和手指,節(jié)點越多,動作越精細。其原理是對身體活動關(guān)節(jié)等部位進行捕捉,通過構(gòu)建人體骨骼模型來還原身體的運動。一邊是綠幕,一邊是實時的虛擬人界面,在3D攝像頭捕捉到綠幕下的人物動作的同時,虛擬人便據(jù)此作出相應(yīng)的反應(yīng)?!袄脛幼鞑蹲津?qū)動的虛擬人,更像是提線木偶,它的動作行為乃至面部表情與真人都是相同的?!痹撊耸勘硎尽?/p>
動捕驅(qū)動與AI驅(qū)動各擅勝場。
據(jù)廣州虛擬動力網(wǎng)絡(luò)技術(shù)有限公司介紹,動捕技術(shù)的一大優(yōu)勢在于它連接了真人和虛擬世界,借助動捕設(shè)備,用戶可重建和增強虛擬世界的體驗感。它能讓用戶的虛擬分身在元宇宙中和其他人保持自然的交流。根據(jù)實時捕捉人物表演的能力,用戶可以借助虛擬形象進行實時互動,增強虛擬交互體驗,其輸出的數(shù)字人內(nèi)容精細度更高、表現(xiàn)力更強、運動動作更加自然。
相比于真人動捕驅(qū)動來說,AI驅(qū)動虛擬人則可以為企業(yè)降本增效,延展營銷邊界,常常用于企業(yè)營銷、新聞傳媒、教育教學(xué)、品牌電商、文旅文博宣傳等領(lǐng)域?!叭绻莿硬都夹g(shù),成本是一秒鐘1000元,這意味著時長一分鐘的視頻,大概需要六萬元。而通過AI的方式去生成,1分鐘只需要30元錢?!睒I(yè)內(nèi)人士表示,兩種方式的成本相差千倍。然而需要注意的是,盡管AI和深度學(xué)習(xí)等技術(shù)的突破在很大程度上降低了虛擬人的制作門檻,但是低成本建模和驅(qū)動的虛擬數(shù)字人,與手工精細制作依舊存在差距。
虛擬數(shù)字人是構(gòu)建元宇宙的基礎(chǔ)設(shè)施,市場廣闊,這也吸引著越來越多的個人與企業(yè)加入“造人”行業(yè)。根據(jù)不同的需求,動作捕捉驅(qū)動與AI驅(qū)動愈發(fā)成為虛擬人行業(yè)涇渭分明的兩個方向。
ToB與ToC,服務(wù)與流量
切換新賽道,步入新領(lǐng)域,不少公司看中的是我國虛擬人產(chǎn)業(yè)蓬勃發(fā)展的勢頭。作為連接數(shù)字世界和現(xiàn)實世界的重要媒介,隨著產(chǎn)業(yè)熱度持續(xù)提升,不少人關(guān)心,未來虛擬人如何與更多行業(yè)場景深度融合,可以為人們帶來哪些更沉浸的數(shù)字生活體驗?
全球來看,虛擬人產(chǎn)業(yè)鏈可分為上中下游三類。虛擬人上游包括內(nèi)容制作類、工具類和IP策劃類;中游主要指XR廠商、CG廠商、AI廠商和綜合類廠商;下游主要涵蓋企業(yè)服務(wù)、文娛領(lǐng)域和品牌代言。
一方面,元宇宙概念下,品牌希望用更親近的方式貼近消費者的生活。另一方面,虛擬數(shù)字人因不受時間、空間與物理技能的限制,其能力也顯示出超越真人的價值,可以發(fā)揮的效用遠非娛樂、商業(yè)產(chǎn)業(yè)那么簡單。具體到商業(yè)模式上,虛擬人業(yè)務(wù)主要分為ToB和ToC兩端,分別對應(yīng)以功能應(yīng)用為主的服務(wù)型虛擬人和以個性表達為主的偶像型虛擬人。前者主要應(yīng)用于影視、金融、文旅等領(lǐng)域,變現(xiàn)方式是為需求方采購服務(wù)型虛擬人,以替代真人。例如,萬科的首位虛擬員工“崔筱盼”負責催辦企業(yè)的預(yù)付應(yīng)收逾期單,小冰AI“超級模式”的定價是360元/年,主要服務(wù)于辦公場景,輔助會議紀要、文案撰寫等工作,其甚至沒有具體的虛擬形象,只存在交互界面。后者主要針對游戲、傳媒等領(lǐng)域,變現(xiàn)模式主要是打造虛擬偶像或虛擬IP,再通過流量變現(xiàn)。以洛天依為例,其深受廣大二次元文化愛好者的喜愛,在B站擁有數(shù)以百萬計的粉絲。粉絲群體也經(jīng)常參與線上直播、線下演出等活動,形成了一個緊密的社群。
當前,我國數(shù)字經(jīng)濟發(fā)展方興未艾,作為其中的一個重要環(huán)節(jié),虛擬人的場景化應(yīng)用有望為數(shù)字經(jīng)濟發(fā)展注入新動能。盡管實踐與理論都已經(jīng)有了相當?shù)倪M步,但不少從業(yè)者依舊認為,當下的虛擬人仍面臨著技術(shù)、成本等痛點,行業(yè)爆發(fā)還要多久,沒有誰可以準確預(yù)測?;蛟S,等到虛擬數(shù)字人精細好看,并且動作靈動、有智慧、有情感,能與人互動,而不只是停留在宣傳片里的時候,虛擬數(shù)字人才能真正走進用戶的生活,迎來爆發(fā)。
其實,不管是功能型的虛擬人,還是面向C端的娛樂性質(zhì)的虛擬人,對真人都沒有完全的替代作用,更多的是作為現(xiàn)實生活的補充。誠然,服務(wù)型虛擬人能夠完成部分工作為企業(yè)創(chuàng)造價值,偶像型虛擬人帶有精神屬性能夠為用戶提供情緒價值,但這些在已有的現(xiàn)實世界中似乎并沒有什么特別。
來源:《小康》·中國小康網(wǎng)?
作者:袁凱
校對:風(fēng)華
審核:龔紫陌