「生數科技」完成數億元Pre-A輪融資,百度投了 | 36氪首發

文 | 周鑫雨

編輯 | 鄧詠儀

36氪獲悉,近日多模態大模型企業“生數科技”完成數億元Pre-A輪融資,該輪融資由北京市人工智能產業投資基金、百度聯合領投,中關村科學城公司等跟投,啓明創投等數位老股東繼續支持。

此前,生數科技已經獲得來自螞蟻集團、BV百度風投、卓源亞洲、錦秋基金、達泰資本、智譜AI等機構的投資。據悉,本輪融資主要用於持續迭代優化自研大模型,並加速產品開發與市場拓展。

生數科技是36氪持續跟進的AI企業。這家成立於2023年的“清華系”多模態企業的核心團隊成員,出自清華大學人工智能研究院。

生數科技是36氪持續跟進的AI企業。這家成立於2023年的“清華系”多模態大模型企業的核心創始成員,出自清華大學人工智能研究院。聯合創始人兼CEO唐家渝是清華大學自然語言處理實驗室碩士,曾任瑞萊智慧副總裁、騰訊優圖實驗室高級產品經理。

生數科技最近一次受到大規模的關注,是在今年4月發佈了性能對標OpenAI Sora的全自研視頻生成模型Vidu,將國產專業級視頻生成的時長天花板,拉高到了16秒,並在畫面逼真度、一致性等方面全面對標Sora。

雖然採用與Sora相似的Diffusion Transformer融合架構,但Vidu的底層技術,則是生數團隊原創研究的成果,甚至比Sora的底層架構發佈得更早——

2022年9月,生數科技就發佈了9.5億參數規模的U-ViT網絡架構,這也是全球首個Diffusion Transformer架構。3個月後,伯克利團隊才發佈了初代DiT架構U-Net,後被應用於Sora的研發。

生數科技創始團隊判斷,大模型的發展必將從語言單一模態走向多模態融合。因此成立之初,生數科技就堅持採用U-ViT融合架構處理多模態數據。2023年3月,團隊又開源了全球首個基於U-ViT架構的多模態擴散模型 UniDiffuser,以此驗證驗證大規模訓練融合架構的可行性與涌現能力。。

除了視頻生成技術的儲備,生數科技在圖像生成、3D生成等多模態領域,也有相應的技術和產品儲備。

生數科技自2021年以來的擴散模型研究成果——免訓練推斷算法Analytic-DPM、全球最快採樣算法DPM-Solver,被Stable Diffusion、DALL·E 2等圖像模型採用。

目前,生數科技採取的是To B和To C兩條腿走路的商業化模式:對B端提供MaaS服務,對C端提供多模態生成應用。

目前,在To B方向,生數科技已將多模態大模型應用於遊戲、影視、文旅、智能終端等場景。

在C端產品的佈局上,生數科技在2023年上線了兩款工具型產品:視覺創意設計平臺PixWeaver、3D資產創建工具VoxCraft。

以下爲投資人評價:

歡迎交流!