世界最新：虛擬現(xiàn)實(shí)的新血液，AI 賦能下的 3D 建模行業(yè)

2023-05-13 21:06:40來源：ZAKER科技

生成式 AI 的上限在哪里？這個(gè)問題的答案或許在短時(shí)間內(nèi)都不會(huì)有答案，至少現(xiàn)在生成式 AI 似乎又征服了一個(gè)新的領(lǐng)域。此前，生成式 AI 的工作范湊主要集中在文字處理、繪畫、聲音處理等方面，但是生成式 AI 的能力顯然遠(yuǎn)不止于此。

【資料圖】

近日，開源生成式 AI 公司 Stability AI 正式發(fā)布了 Stable Animation SDK，以及備受關(guān)注的 Stable Diffusion 模型（以下簡稱 Stable）也正式公布新版本，現(xiàn)在用戶可以更好的控制 AI 生成的 3D 模型，并且對(duì)特定參數(shù)進(jìn)行修改。

或許很多人看到這個(gè)消息的想法是："3D 模型？是指方塊、長條之類的東西？"，畢竟在多數(shù)人看來，真正的 3D 建模復(fù)雜性恐怕是普通 AI 難以處理的。不過，生成式 AI 的魅力就在這里，通過對(duì)數(shù)據(jù)的處理與分析，配合對(duì)自然語言的理解，如今的 AI 可以根據(jù)描述生成更加復(fù)雜、完善的模型，并不僅限于簡單的方塊模型。

在此之前，Stable 就因?yàn)榭梢詫?2D 畫面、描述直接轉(zhuǎn)換成 3D 模型而引起了許多關(guān)注，Stable 生成的 3D 模型在精細(xì)度上雖然比不上專業(yè)人員花長時(shí)間搭建的模型，但是考慮到生成所需的時(shí)間，也足以帶給大家不小的震撼。

而在 Stability AI 公布的最新演示視頻中，Stable 的 3D 模型已經(jīng)不僅限于靜物，即使是一直在運(yùn)動(dòng)的人物形象，也可以輕松轉(zhuǎn)變?yōu)?3D 模型，并且運(yùn)動(dòng)的幅度、姿勢(shì)都與原版十分接近。類似的技術(shù)在動(dòng)畫制作中其實(shí)經(jīng)常被用到，一些動(dòng)畫為了讓畫面、物體顯得更具有立體感時(shí)，就會(huì)通過 2D 轉(zhuǎn) 3D 的方式來制作這段畫面，凸顯畫面的張力

圖源：Stability AI

而在傳統(tǒng)的動(dòng)畫行業(yè)里，想要將 2D 畫面轉(zhuǎn)為 3D，需要不少工作人員忙碌一段時(shí)間，而在 Stable 的幫助下，只需要將 2D 畫面輸入模型中，即可獲得高質(zhì)量的起始 3D 模型，大幅度降低建模所需的時(shí)間與成本。

當(dāng)然，如果只是這樣，或許也就從業(yè)者會(huì)高興，對(duì)于廣大網(wǎng)友來說，Stable 又有什么用呢？關(guān)鍵就在于 Stable 的 3D 模型生成并不需要精細(xì)的引導(dǎo)，即使只是簡筆畫，Stable 也可以生成出大差不差的 3D 模型，比如這幅如圖幼兒園小孩般的涂鴉，經(jīng)過 Stable 的 " 潤色 " 后就變成了一個(gè)還算能看的 3D 畫面。

圖源：YouTube

讓你的一切繪畫作品，甚至文字動(dòng)起來，這就是 Stable 的期盼與目標(biāo)。所以，Stability AI 的所有成果都是直接公開，以開源的方式提供給網(wǎng)友使用，對(duì)于廣大二次元愛好者來說，或許這是讓他們的 " 紙片老婆 " 們動(dòng)起來的最簡單方法。

而且從 Stable 的 3D 動(dòng)態(tài)模型生成能力中，我們也可以看到一些未來的應(yīng)用場景，比如更低廉、便利的動(dòng)作捕捉系統(tǒng)，理論上只要算力足夠，就可以通過攝像頭捕捉的畫面實(shí)時(shí)生成對(duì)應(yīng)的 3D 模型動(dòng)作。

除此之外還有什么妙用呢？不知道大家是否有看過近日的一個(gè)熱聞，海外網(wǎng)紅 Caryn Marjorie 通過與 AI 團(tuán)隊(duì)合作，用 GPT-4 復(fù)制了一個(gè)數(shù)字版的自己，然后將數(shù)字版的使用權(quán)以每分鐘一美元的價(jià)格出售給自己的粉絲。

在短短的一周里，Caryn Marjorie 就以此獲得了 7.1 萬美元的收入，而她提供的僅僅是語音對(duì)話閑聊服務(wù)。作為視覺生物，我們對(duì)于聲音的敏感度其實(shí)要低于畫面，如果 Stable 也被應(yīng)用到相關(guān)領(lǐng)域，是否可能打造出真正意義上的 AI 女友呢？可動(dòng)、可聊，足以撫慰你空虛的內(nèi)心。

咳咳，好吧，這個(gè)話題先打住，至少在目前的模型效率和算力規(guī)模下，個(gè)人想要實(shí)現(xiàn)實(shí)時(shí)且高規(guī)格的 3D 動(dòng)態(tài)模型生成，恐怕還十分困難，但是考慮到半導(dǎo)體行業(yè)的進(jìn)步速度，或許這一天離我們并不遙遠(yuǎn)。

Stable 此前最大的問題在于只能根據(jù)描述或圖像來生成 3D 模型，如果生成的效果不好，只能重新調(diào)整圖像或文字信息來重新生成，根據(jù)顯卡的性能不同，3D 模型的生成時(shí)間也會(huì)有所區(qū)別，相較于 ChatGPT 等傳統(tǒng)問答式 AI，Stable 的時(shí)間成本高很多。

所以，雖然 Stable 的 3D 模型生成效果遠(yuǎn)優(yōu)于以往的類似應(yīng)用，使用場景卻十分受限，僅僅是能夠給社區(qū)愛好者提供一個(gè)簡單便利的 3D 模型生成工具。一直以來，社區(qū)用戶都希望 Stability AI 就可以給 Stabel 增加參數(shù)調(diào)整功能，這樣就可以對(duì)不滿意的模型細(xì)節(jié)進(jìn)行修改。

Stability AI 給出的回應(yīng)就是 Stable Animation SDK，該接口可以被加載到 Stabel 的模型中，用戶在使用 Stabel 生成 3D 模型后，可以通過接口直接輸入對(duì)應(yīng)的參數(shù)，調(diào)整或增加模型的細(xì)節(jié)，讓模型更符合用戶的要求。

圖源：Stability AI

從接口的描述文件來看，支持修改的參數(shù)非常多，從基礎(chǔ)的顏色、形狀、大小、紋理到動(dòng)作姿勢(shì)等都可以進(jìn)行調(diào)節(jié)，而且調(diào)節(jié)過程并不需要輸入專業(yè)數(shù)據(jù)或是名詞，只需要如圖生成 3D 模型時(shí)一樣輸入文字信息即可。

比如你生成了一只小狗的 3D 模型，然后覺得小狗身上的花紋不太滿意，只需要從接口輸入你想要的花紋描述，Stabel 就會(huì)根據(jù)描述對(duì)模型進(jìn)行修改并重新渲染相關(guān)圖層。

除此之外，Stable Animation SDK 還支持動(dòng)作命令的輸入，可以讓靜態(tài)的 3D 模型直接執(zhí)行你的動(dòng)作指令，比如你渲染了一只飛龍，然后輸入指令 " 讓龍飛起來噴火 "，Stable 就會(huì)開始對(duì) 3D 模型進(jìn)行動(dòng)作渲染。

而且 Stable 還提供攝影功能，用戶可以調(diào)整拍攝機(jī)位、照明效果、背景等一系列的參數(shù)，對(duì) 3D 模型進(jìn)行靜態(tài)和動(dòng)態(tài)的錄像。是的，大家估計(jì)都猜到了，3D 建模、3D 動(dòng)畫等與 3D 建模有關(guān)的行業(yè)，都將會(huì)感受到來自 AI 的 " 溫暖 "。

另外，部分網(wǎng)友認(rèn)為 Stable 與虛擬現(xiàn)實(shí)設(shè)備結(jié)合，或許會(huì)讓虛擬現(xiàn)實(shí)設(shè)備的生產(chǎn)力表現(xiàn)得到飛躍式提升。大家應(yīng)該都看過漫威電影《鋼鐵俠》，電影主角史塔克就擁有一個(gè)高級(jí)人工智能程序 " 賈維斯 "，在史塔克制造鋼鐵俠鎧甲時(shí)給予了許多幫助。

圖源：鋼鐵俠

其中一個(gè)片段就是史塔克通過對(duì)話直接生成了一個(gè)零件的 3D 模型，然后對(duì)其進(jìn)行調(diào)整并應(yīng)用到鎧甲上，這套流程聽起來是不是有點(diǎn)耳熟？沒錯(cuò)，某種意義上這就是 Stable+ChatGPT 的未來版本，通過對(duì)話直接創(chuàng)造出 3D 模型，讓設(shè)計(jì)師可以在虛擬現(xiàn)實(shí)設(shè)備中直接檢視物品的外觀、使用效果等。

將這個(gè)過程放到現(xiàn)實(shí)生活照，就相當(dāng)于將產(chǎn)品設(shè)計(jì)中最耗時(shí)的打樣、調(diào)整過程簡化，實(shí)質(zhì)性的提高產(chǎn)品從設(shè)計(jì)到落地的整個(gè)流程效率。而且，結(jié)合虛擬現(xiàn)實(shí)設(shè)備的功能，甚至可以讓設(shè)計(jì)師提前在虛擬現(xiàn)實(shí)中使用和體驗(yàn)自己的產(chǎn)品。

當(dāng)然，現(xiàn)在的產(chǎn)品設(shè)計(jì)流程中，其實(shí)就已經(jīng)廣泛利用類似的 3D 模型軟件來渲染場景，但是 Stable 的優(yōu)勢(shì)在于生成的速度，本來需要數(shù)小時(shí)甚至數(shù)天進(jìn)行調(diào)整渲染的模型，如今只需要十分之一或更短的時(shí)間即可生成，背后所帶來的效率提升不言而喻。

隨著生成式 AI 的遍地開花，可以看到 AI 對(duì)我們的社會(huì)、生產(chǎn)等方面會(huì)造成十分深遠(yuǎn)的影響，今天是 3D 模型，明天又會(huì)是什么？我非常期待。

關(guān)鍵詞：

責(zé)任編輯：hnmd003