誰在“操控”虛擬人?

©自象限原創

作者|程心

編輯|周遊

大模型的風,吹動虛擬數字人廠商野蠻生長(以下統稱虛擬人)。

《虛擬數字人深度產業報告》預計,到2030年我國虛擬數字人整體市場規模將達到2700億元,其中,“服務型虛擬人”總規模也將超過950億元。

如同禿鷹盯上腐肉,嗅到萬億商機的各方勢力,都欲分一杯羹,這也直接導致了目前的虛擬人玩家格局陷入了“混戰”狀態。

「自象限」根據各方數據不完全統計,目前國內虛擬數字人核心廠商約有6000家。而按天眼查的數據顯示,相關廠商數量甚至超過6萬家。

同時,隨着大模型(Large Model)的興起,虛擬人的產業格局也在發生深刻變化。

比如,虛擬人正在經歷從製作流程降本到技術突破的關鍵階段,從大語言模型到多模態能力,讓虛擬人從展示突破到了實時互動,這意味着未來虛擬人可能只需要一個實時渲染的外觀,就能擁有十分逼真的溝通能力。技術門檻的降低,也會讓更多參與方加入到這個開拓中的市場。而狂奔半年後,百億個虛擬人也逐漸滲透進各行各業,並逐步進入商業化階段。

也就是說,在廠商“混戰”的表面下,隱藏的不僅是巨大的商業利益,更是複雜的技術博弈。而牽動着虛擬人“木偶引線”的另一頭,操控者們的世界也在發生翻天覆地的變化。

如果說元宇宙時期的虛擬人已經是一把大火,那大模型就相當於在這之上又烹上了一勺油。一瞬間,鋪天蓋地的數字人廠商涌來,將本就複雜的行業攪得愈發渾濁。

這其中,既包括從元宇宙時期就一直堅持虛擬數字人的廠商,也有依靠全棧技術優勢輕鬆邁出第一步的大廠,更不乏聞風而來的換道廠商。

「自象限」初步了統計核心廠商的類型後發現,這些廠商大致可以分爲四類:

第一類是互聯網大廠,如騰訊、百度、阿里、京東、本站等。這裡面其實也分兩類,一類是騰訊、百度爲代表,他們業務龐大,在面向To B的解決方案上,比如金融、文旅、汽車等場景,需要一個數字人形象來符合新的交互方式。對於這些企業,數字人只是業務的一個補充。另一類則是本站爲代表的,具有技術積累的企業,由於本站在遊戲建模、AI捏臉等方面豐富的探索和技術積累,讓他們需要通過虛擬人將這些沉澱的資源轉化。

第二類是原生廠商。這是較早佈局數字人的一批廠商,如即構科技、魔琺科技、硅基智能、風平智能、數字栩生、相芯科技等。這類廠商或屬於上一波元宇宙創業的“遺珠”,或屬於市場早期以電商直播帶貨、本地生活直播等場景切入數字人場景的公司,得益於AIGC技術,其中的一些公司完成了從2D數字人到3D數字人的升級。

第三類是換道廠商。基於原有技術延伸入局數字人賽道,如:商湯、華爲、科大訊飛、快手、360、美圖、蔚領時代、元境科技、新壹科技等。這類廠商在發展過程中積累了一些涉及數字人的技術。譬如商湯的視覺識別技術、科大訊飛的語言識別技術、蔚領時代的遊戲渲染技術等等,以這些技術爲突破口再結合大模型的發展,完成了賽道的轉換。

第四類是跨界廠商。他們因爲自身業務場景需求而下探數字人技術,如萬興科技、藍色光標、謙尋、高途、中公教育等。這類廠商的特點是其原本業務與數字人並無太大交集,如萬興科技主營業務是提供文圖、剪輯類的基礎工具,衍生出爲客戶提供數字人工具;藍色光標的主要業務爲廣告業務,通過數字人可以更好的完成客戶的需求;而謙尋則是一家MCN公司。但隨着應用和場景的拓展,數字人成爲了其新的發力方向,萬興科技借數字人進一步開拓了海外直播、營銷業務,謙尋藉由數字人找尋到了新一輪直播帶貨流量、成交額增長動力。

源於“出身”的不同,不同廠商的商業模式和目標也完全不同。

大廠的虛擬人多爲服務自身核心戰略而生,比如阿里、京東的虛擬人多被應用在電商領域;騰訊將移動互聯網時代積累下來的RTC(實時通信技術)應用在虛擬人交互中,打造了智影製作平臺;百度希壤更偏向於表演型虛擬人,爲不同企業提供定製化代言人;而本站則將虛擬人應用在遊戲、教育等多個自身業務中。總的來說,互聯網大廠並沒有急於將虛擬人獨立對外商業化,而是受自身技術的積累和場景需求催生。

核心對外提供服務的主要是原生的數字人廠商和換道廠商,從上個風口到如今,這類廠商已經積累了數字人的技術經驗,對於底層技術、細節把控和場景的探索都有着更爲體系化的認知。根據技術路線的不同,原生廠商又被分爲2D廠商和3D廠商,2D廠商更傾向於虛擬人與場景的結合,而3D廠商則處於技術迭代的狀態。

“2D虛擬人制作有兩種方式,一種是請真人錄製,然後幫其定製形象。一種是從用戶提供的視頻中提取形象,再用到各種場景中。但是2D數字人沒辦法做到3D那樣轉身、跳舞、做各種動作。”即構科技對二者的製作差異進行了詳細解釋。

但由於2D虛擬人的製作成本低,帶動了整個虛擬人市場“飛入尋常百姓家”,填補了市場由於價格攔路而不能落地的需求鴻溝。「自象限」瞭解到,目前原廠廠商是大公司和品牌側傾向的選擇,通過行業KA客戶打造標杆案例,比如銀行、大型消費品品牌(健力寶)、美妝品牌(HR赫蓮娜)等等。

換道廠商和跨界廠商有異曲同工之筆,如商湯、美圖等換道廠商,在上個階段積累了CV、圖像識別等技術,被應用在了虛擬人的製作中,而像藍標、謙尋等公司,源於自身的需求出發,爲了避免高昂的採購成本,也選擇自研虛擬人,技術不夠硬核但有固定的客戶羣,商業化冷啓動相對迅速。

今年8月、9月開始,虛擬人廠商產品開始加速迭代。據不完全統計,兩個月內至少有10家廠商發佈了新的虛擬人產品。

產品的高度迭代意味着虛擬人正在飛快得適應市場需求,而這也意味着虛擬人第一階段的賽點已經走入關鍵階段。

從類型來看,虛擬人廠商分爲兩類,一類直接交付虛擬人產品,包括通用虛擬人產品、行業垂直場景的虛擬人產品,比如電商、零售、營銷、直播等,客戶即拿即用,或標準化或定製化;另一類則提供虛擬人制作平臺,客戶通過使用平臺提供的工具,自主生產虛擬人。

相比之下,產品交付類型更適合企業探索虛擬人初期,幾乎不需要技術團隊配合,門檻更低,也是目前較多企業選擇的方式。

針對這類產品形式,虛擬人廠商也提供了多樣的購買方案。如汽車試駕一樣,品牌在購買虛擬人之前,可以先可進行Demo的試用,真實感受虛擬人的表情、動作、交互等等。除此之外,品牌在購買前還可以進行方案諮詢,廠商會根據客戶情況,制定具體的虛擬人傳播方案,並有多種不同風格的虛擬人可以選擇。

以即構虛擬人Avatar爲例,企業可選擇擬人形象和Q版形象,並可以在線直接體驗給虛擬人換裝、捏臉,並通過AI完成了表情驅動、聲音驅動、文本驅動、肢體驅動等全方位的驅動方式。

提供製作平臺的廠商產品則更加複雜,如魔琺科技的三款產品分別針對了不同場景進行,包括虛擬視頻、虛擬人直播和獨立的虛擬人服務,並且在後端打造了端到端的寫實3D虛擬人工業化產線,包括從技術到調試到運營的“星雲平臺”,讓虛擬人能夠和大模型結合,長出“腦子”,真正實現3D交互。

今年8月,魔琺科技升級了有言AIGC生成平臺、有光直播帶貨平臺和有靈虛擬人制作平臺,爲企業提供系列生成工具,企業根據自身需求,能夠更加靈活的調整虛擬人的細節、結構和適配的使用場景。

相比之下,商湯既能夠直接交付虛擬人產品,也打造瞭如影虛擬人制作平臺,基於在視覺、語音領域積累的3萬個算法模型,打造了集智能化生成、智能化驅動、智能化交互的數字人平臺。在商湯智能化引擎驅動下,虛擬人能快速識別、反應,與用戶建立起對話關係。並且,事後,虛擬人也不會“失憶”,繼續學習迭代。

這也說明了,當下廠商不僅是商業模式上的競爭,更是技術先進性的比拼。

從整個虛擬人的技術發展進程來說,大模型帶來最核心的改變,是推動着虛擬人從第一階段看起來“像人”,到能夠與人實時互動。

第一階段,虛擬人廠商比拼的是“誰看起來更像人”?虛擬人廠商的核心技術多在傳統的CG(建模)技術、驅動技術、渲染引擎等等,所以虛擬代言人爲代表的表演型虛擬人成爲了核心交付產品。

但由於技術的不成熟導致了虛擬人制作成本高企,「自象限」從行業內人士瞭解到,2022年,某大廠提供的訂製虛擬人價格高達10萬,這讓虛擬人根本無法規模化落地。

大模型來了之後,一方面讓虛擬人制作成本進行了大幅度降低;另一方面,AI技術加速了虛擬人的交互功能,讓虛擬人交互起來更像人。

某虛擬人制作廠商曾吐槽:“以前6888元一個,賣一個賠一個”,通過智能渲染、智能驅動,流程自動化製作等能力,讓虛擬人的製作成本有了30%-50%的縮減,市面上甚至冒出了“99元、299元一個的虛擬人”。

更重要的是,大模型技術加速了虛擬人對語言語義的理解能力,讓虛擬人能夠從簡單的檢索生成,到語言文字AI驅動,更快速的對人的需求進行回覆,甚至做到“秒回”,同時模型也驅動了渲染技術、擬真技術、超寫實技術的進化。

舉個具體的例子:交互的核心並不只是動作反饋,更是內容的生成和語音的交流,故而,AIGC技術和語音生成技術成爲了當下技術發展的核心。

大模型讓虛擬人“長了腦子”,有了思考和推理能力,AIGC技術讓虛擬人能夠有“想法”,TTS(Text To Speech 文本轉語音技術)技術則讓虛擬人能夠“表達”。

幾天前,在GPT-4V版本更新,TTS實現了進步,文本驅動語音有了語氣和口吻,在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻,甚至設定“渣女”時還學會了“夾子音”。

有行業專家推測:TTS技術端到端成熟後,對行業格局的改變會很大。因爲虛擬人真的能夠實時交互後,落到產業裡才能產生實際價值。

從看起來像人,到實時互動,大模型推動着虛擬人完成二級階躍,但這也只是一個新的開始。從元宇宙到大模型時代,虛擬人真正備受關注的內在原因在於,他將有可能是下一個虛擬時代的“入口”,背後連接着新的虛擬世界,入口屬性讓其變的既性感又危險。

國外最早佈局虛擬人的微軟小冰CEO李笛則認爲:虛擬人未來是混合模型。

本質上,這兩種觀點的內核是一致的,只不過李笛的假設更爲具體。下一階段,將進入“虛擬人+”的階段,虛擬人+RPA在企業內部打造數字員工;虛擬人+AI Agent,在C端打造陪伴型機器人;虛擬人+AR/VR,在3D空間打造可見的遊戲NPC;虛擬人+具身智能,讓人型機器人有了靈魂。

若將多種技術進行全面融合,虛擬人才真的能夠成爲“入口級應用”。屆時,比拼的賽點將是虛擬人的開放程度、生態建設、場景拓展等一系列綜合能力。

當虛擬人被賦予了更多能力,其背後的木偶引線到底還能否掌握在人的手裡?

這個答案,也着實讓人期待。