像做 PPT 一樣做短視頻和直播?

2023-08-14 07:16:23來(lái)源:ZAKER科技  

讓創(chuàng)意被激發(fā),讓創(chuàng)作更簡(jiǎn)單 ??????????????????????????????????


(資料圖)

文 | 陳首丞 ???????????

編 | 石燦

8 月 10 號(hào)的快手光合創(chuàng)作者大會(huì)上,高管圓桌環(huán)節(jié)開始前,一笑、于越、Thomas 和笑古分別在視頻中做了自我介紹。

只不過(guò),視頻中出現(xiàn)的并非真人,而是 " 一笑分笑 "、" 于越分越 "、"Thomas 分托 " 和 " 笑古分古 " ——快手高管們的數(shù)字人分身。

這些真假難辨的數(shù)字人,來(lái)自快手首次公開的 AIGC 數(shù)字人解決方案:快手智播,可以低成本創(chuàng)建數(shù)字人直播,制作數(shù)字人短視頻。用戶只需 3-5 分鐘的少量視頻素材,用時(shí) 3 天花費(fèi)千元,就可制成孿生數(shù)字人。目前,快手智播可在本地消費(fèi)、本地生活、電商直播等多種場(chǎng)景落地。

正如快手 AI& 用戶增長(zhǎng)業(yè)務(wù)負(fù)責(zé)人王仲遠(yuǎn)所說(shuō):身處這場(chǎng) AI 技術(shù)變革之中,我們堅(jiān)信 AIGC 將賦予普通用戶更多的創(chuàng)作權(quán)力和自由,也堅(jiān)信 AIGC 將成為短視頻內(nèi)容生產(chǎn)的基礎(chǔ)設(shè)施。

數(shù)字人,用在哪????????

在直播帶貨的達(dá)播領(lǐng)域,人貨場(chǎng)仍然是不可切分的緊密三角,數(shù)字人很難取真人而代之。但在非達(dá)播的場(chǎng)景,數(shù)字人有廣闊的應(yīng)用空間,且能大幅提升從業(yè)者的工作效率。

據(jù)了解,僅以快手為例,AI 數(shù)字人在本地生活、本地消費(fèi)、24 小時(shí)店播和海外商業(yè)素材生產(chǎn)等場(chǎng)景有廣泛的應(yīng)用,且曝光轉(zhuǎn)化率等核心指標(biāo)和大盤相比高達(dá) 203%。

以快手的快聘業(yè)務(wù)為例,快手智播月均生產(chǎn)數(shù)字人素材上千條,以中低粉段達(dá)人拍攝視頻為基準(zhǔn)計(jì)算,單條短視頻創(chuàng)作成本降低到人工成本的 5% 以下。

顯然,同樣是招聘,在傳統(tǒng)的招聘平臺(tái)上發(fā)布文字信息的成本,要遠(yuǎn)遠(yuǎn)低于在短視頻平臺(tái)制作視頻的成本。在更早的時(shí)期,這一問(wèn)題限制了招聘的短視頻化和本地生活化,讓有招聘需求的一方望而卻步。

但 AI 數(shù)字人的誕生和快手智播的存在,讓客戶可以像做 PPT 一樣做視頻和直播,僅需輸入文案,就可配置視頻,再通過(guò)快手的算法分發(fā)邏輯,將視頻推送給廣大有潛在需求的人群。這不僅利用了快手的用戶量和算法優(yōu)勢(shì),又將招聘方的成本降到了合理的程度。

招聘之外,AI 數(shù)字人在一些領(lǐng)域的表現(xiàn)也堪稱優(yōu)秀。比如本地生活,有服務(wù)商一次性投入五十個(gè)以上的賬號(hào)進(jìn)行開播,一個(gè)月內(nèi)有效總直播時(shí)長(zhǎng)達(dá) 11640 小時(shí),帶來(lái)了 1.1 萬(wàn)個(gè)訂單和近百萬(wàn)的 GMV,轉(zhuǎn)化率是真人的兩倍,且成本還要更低。

其中,滬上吃喝玩樂花花系列賬號(hào)某快餐漢堡套餐單品一個(gè)月賣出近 3000 份;某游樂園全日門票單品一個(gè)月賣出 30 萬(wàn)元,實(shí)際核銷率接近 60%,近似真人直播效果。

至于直播帶貨的店播場(chǎng)景,在更早期的時(shí)間里,就有將 24:00-6:00 的時(shí)間段交給虛擬主播,用以保持直播間的 24 小時(shí)運(yùn)營(yíng)和基礎(chǔ)商品介紹功能的案例。24 小時(shí)的 AI 數(shù)字人直播間則是更加激進(jìn)的嘗試,這一方面是因?yàn)閿?shù)字人建模的能力在提升,達(dá)到了 " 真假難辨 " 的地步,另一方面也是因?yàn)榈瓴ケ旧淼奶厥鈱傩裕? 貨 " 比 " 人 " 要更重要。

24 小時(shí)店播的效果也不比真人要差,以美妝店鋪泉兮旗艦店為例,數(shù)字人測(cè)試直播半個(gè)月期間,人均觀看、3s 播放率、轉(zhuǎn)化效率和商品訪問(wèn)下單率均比該直播間真人主播表現(xiàn)更好,每場(chǎng)直播 GMV 貢獻(xiàn)近萬(wàn)元。

花西子直播間也同樣使用了數(shù)字人主播,并對(duì)數(shù)字人的效果表示:" 很多客戶提問(wèn)交流,有可能我們效果太逼真,用戶沒看出是數(shù)字人,還是會(huì)問(wèn)很多問(wèn)題,我們也能迅速回復(fù)。"

在這種情況下,AI 數(shù)字人也就有了大展身手的空間。更低的成本和更好的效果,讓 AI 數(shù)字人更具競(jìng)爭(zhēng)力。

3 分鐘,3 天,千元成本 AIGC 數(shù)字人的三個(gè)關(guān)鍵詞 ??????????

數(shù)字人并非一個(gè)新鮮產(chǎn)物,在生成式 AI 進(jìn)入該領(lǐng)域之前,就已經(jīng)有一些數(shù)字人 IP 獲得了不小的成功。

2021 年開始,與元宇宙概念相關(guān)的虛擬偶像率先出圈,如 A-soul、柳夜熙和狐璃璃等,他們往往有大平臺(tái)扶持的背景,且都吸引了不小的聲量,其中,A-soul 主要成員 " 嘉然今天吃什么 " 是 B 站百大 UP 主,柳夜熙在抖音擁有超 800 萬(wàn)粉絲,狐璃璃在快手擁有超 400 萬(wàn)粉絲,均是平臺(tái)頭部創(chuàng)作者。

不過(guò),這批 3D 數(shù)字人 IP,在商業(yè)化路徑上仍然走的是傳統(tǒng)流量經(jīng)濟(jì)的老路,收入來(lái)源以直播打賞或者廣告代言為主,這與其制作方成本的投入并不匹配。而且," 中之人 " 的存在,也讓這批數(shù)字人 IP 面臨一定的 " 塌房 " 風(fēng)險(xiǎn),難以成為真正的 " 數(shù)字 " 偶像。行業(yè)中也曾有過(guò)專為直播帶貨而生的 IP,如遙望科技旗下的數(shù)字偶像 " 孔襄 ",不過(guò)該數(shù)字人目前已經(jīng)停更,鮮有新動(dòng)向。

行業(yè)中更加廣泛存在的,則是數(shù)量龐大的 2D 數(shù)字人,在更早的時(shí)間段主要服務(wù)于政府、金融等行業(yè),C 端用戶則無(wú)明顯感知。2023 年開始,在生成式 AI 技術(shù)的加持下,有了爆發(fā)性的增長(zhǎng)。

一批公司也因此吃到了行業(yè)增長(zhǎng)的紅利,在抖音平臺(tái),虛擬人創(chuàng)業(yè)公司硅基智能已經(jīng)服務(wù)了上萬(wàn)個(gè)客戶,主要聚集在本地生活和直播電商領(lǐng)域,也進(jìn)入了 C 輪融資階段,是數(shù)字人直播領(lǐng)域的頭部公司。

此外,行業(yè)內(nèi)還有定位 SaaS 版本視頻剪輯工具,專門服務(wù)于地方電視臺(tái),銀行,國(guó)家機(jī)關(guān)和地方政企的騰訊智影,以及主要給政務(wù),金融客戶提供定制化解決方案的百度靈犀和給短視頻賬號(hào)公司服務(wù)的閃剪等等。

除了定位于營(yíng)銷場(chǎng)景的政企、傳媒、金融行業(yè)之外,短視頻和直播帶貨的數(shù)字人需求往往聚焦于垂類,比如短視頻中的口播場(chǎng)景以及直播帶貨中的標(biāo)品店播場(chǎng)景,這部分內(nèi)容對(duì)人的表現(xiàn)力需求不強(qiáng),因此能夠由數(shù)字人完美取代。

基于此,快手自研的 AIGC 數(shù)字人解決方案快手智播有著天然優(yōu)勢(shì),其與快手業(yè)務(wù)系統(tǒng)的深度打通,能更好的為快手生態(tài)服務(wù)。比如其完美匹配快手的直播系統(tǒng)和風(fēng)控系統(tǒng),還能自動(dòng)掛車和切換講解卡,同時(shí)回答觀眾的提問(wèn),和觀眾實(shí)時(shí)互動(dòng),這一過(guò)程又進(jìn)一步節(jié)省了人力的使用。

最低只需要 3 分鐘的視頻和音頻素材,用時(shí) 3 天,就可以制作相應(yīng)的數(shù)字孿生形象,同時(shí)快手還將提供整套的 SaaS 服務(wù)工具,不需要用戶另外采購(gòu)任何硬件設(shè)備,只需輸入短視頻文案或者直播稿,就可一鍵生成視頻或開播。這套流程在當(dāng)前的技術(shù)能力下,僅需千元即可完成,而此前傳統(tǒng)數(shù)字人制作費(fèi)用一般需 10 萬(wàn)元以上。

據(jù)快手技術(shù)人員介紹,為了達(dá)到目前的擬真度,快手基于自研高精度 3D 面部重建算法進(jìn)行了 3D 建模,還在數(shù)萬(wàn)小時(shí)的模特?cái)?shù)據(jù)上進(jìn)行了訓(xùn)練,又針對(duì)每個(gè)具體模特進(jìn)行了微調(diào)。

而為了實(shí)現(xiàn)實(shí)時(shí)性,快手還有自研的推理引擎、部署框架、以及在多個(gè)業(yè)務(wù)中得以迭代的流式的數(shù)字人生成框架,能夠以秒級(jí)的低延遲實(shí)現(xiàn)數(shù)字人直播。

數(shù)字人背后,快手布局全模態(tài)大模型 AIGC?

實(shí)際上,數(shù)字人產(chǎn)品只是快手 AIGC 系列部署中的一環(huán),在光合大會(huì)上,王仲遠(yuǎn)強(qiáng)調(diào)了一個(gè)概念:全模態(tài)、大模型 AIGC。

他表示:創(chuàng)作本身是一件需要?jiǎng)?chuàng)意和專業(yè)度的事情,持續(xù)創(chuàng)作優(yōu)質(zhì)作品會(huì)讓很多創(chuàng)作者感到壓力。以一個(gè)美食創(chuàng)作者為例,分享一道或十道拿手菜并不是難事,但長(zhǎng)期堅(jiān)持下去,總會(huì)在創(chuàng)意、素材和視頻制作等方面遇到難題。

而所謂的全模態(tài)、大模型 AIGC 解決方案,就是為了解決創(chuàng)作者在創(chuàng)作過(guò)程中的各種痛點(diǎn)而生。據(jù)王仲遠(yuǎn)介紹,這套方案可以幫助創(chuàng)作者更好的激發(fā)創(chuàng)意,用戶只需一個(gè)指令,就可以讓大模型幫助自己完成故事撰寫、腳本整理,并能夠基于場(chǎng)景主題生成對(duì)應(yīng)的圖片和配樂。用戶不用再絞盡腦汁反復(fù)腦暴,可以讓大模型提供更多的靈感和創(chuàng)意。

在大會(huì)上,王仲遠(yuǎn)還展示了大模型的素材繪制功能,針對(duì)周杰倫創(chuàng)作的歌曲《七里香》,大模型自動(dòng)畫出了相關(guān)畫面,這也就意味著,創(chuàng)作者在使用快手大模型的時(shí)候,可以自由地提供場(chǎng)景描述來(lái)獲得素材,最終簡(jiǎn)化創(chuàng)作視頻的流程。在電商場(chǎng)景上,大模型也可以幫助 B 端創(chuàng)作者將所售商品進(jìn)行 3D 化展示,進(jìn)一步提升消費(fèi)體驗(yàn)。

甚至,傳統(tǒng)視頻直播中費(fèi)時(shí)費(fèi)力門檻頗高的剪輯工作,也可以由快手大模型的 AIGC 解決方案取代。創(chuàng)作者只要自行上傳相關(guān)素材,就可以得到相應(yīng)的短視頻內(nèi)容。

此前,不少大模型產(chǎn)品都是針對(duì)某項(xiàng)具體的場(chǎng)景應(yīng)用,譬如對(duì)話提供相應(yīng)的文字解決方案或者 AI 智能生成圖片。而快手的全模態(tài)、大模型 AIGC,不只定位于個(gè)別功能,而是聚焦于用戶在快手的各種需求,讓用戶在創(chuàng)作視頻和帶貨的每一步都能得到 AI 的幫助。

而這,顯然更符合 AI 誕生的本意,AI 出現(xiàn),不是為了取代誰(shuí)的工作,而是幫助人類把工作變得更簡(jiǎn)單。全模態(tài) AIGC 如此,快手智播這一產(chǎn)品更是如此。在以人為核心,以創(chuàng)作者為核心的基本價(jià)值觀下,相信每一個(gè)快手的創(chuàng)作者,都可以用好 AI,在快手獲得更好的創(chuàng)作體驗(yàn)。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀