文化灣企說丨兔展智能:從定義H5到復現“Sora”,All in國產視覺大模型

編者按:

2024粵港澳大灣區文化產業投資大會(廣東·廣州)將於11月20日至22日舉辦。大會以“文化金融灣區領航,產業科技互促雙強”爲主題,立足灣區、面向全國,着力打造國家級文化金融品牌平臺。南方財經全媒體集團策劃推出《文化灣企說》系列報道,走訪一批文化科技、數字內容、融合業態等文化領域新質生產力代表,聽他們講述文投大會背後的故事以及自身發展歷程,傳遞廣東文化產業新質生產力孕育一線的脈搏。

南方財經全媒體見習記者張夢琦 深圳報道

2014年,當大多數企業還在依賴傳統營銷傳播時,深圳兔展智能科技有限公司(簡稱“兔展智能”)已決定“換道行駛”,率先定義“H5”這一全新內容表現形式,併成爲最早推出H5零代碼免費編輯平臺的公司之一。隨後幾年,這一形式風靡微信朋友圈。

如今,面對生成式AI的浪潮,兔展智能再一次立上潮頭。Sora發佈僅一個月後,兔展智能開始了復現“開源版Sora”計劃。

“中國是世界上製造大國,有很多獨有的視覺數據資源,期待將Open-Sora Plan打造成深植於產業、賦能產業發展的中國本土視覺大模型,通過產業公司和科研機構的強強聯手,以開源的方式對外傳播中國團隊的技術自信,號召全球社區一起做人類普惠的技術內容。”兔展智能CEO董少靈在接受南方財經全媒體記者採訪時表示,公司創立以來自主研發了新一代內容引擎、傳播大數據工具、營銷雲平臺、數字人工具等產品,目前已積累了4000萬平臺註冊用戶、1500萬政企組織客戶。

今年2月,OpenAI發佈的文生視頻大模型Sora震驚世界,其用文本生成的視頻畫質精良逼真,在視頻長度、質量以及可控性等方面均達到了當前的技術最高水平。

國內隨即引發熱切討論,“我們能否做出本土的、中文版的Sora嗎”?

兔展智能基於長期的技術沉澱,在今年3月聯合北京大學深圳研究生院推出Open-Sora Plan,集結開源社區的力量,力求在這一炙手可熱的視頻生成領域有所作爲。

“今年3至9月,Open-Sora Plan已成爲全球技術社羣裡引用最高的視覺開源模型。”董少靈介紹,該項目在GitHub上一經發布,就立馬引起國際人工智能界相當大的關注。發佈一週內就有超5000名技術開發人員爲該項目標星,融合了30餘次開源創作者的拉取請求(Pull Request),獲得14萬餘次訪問,代碼被克隆超800次,來自美國、英國、加拿大、德國、澳大利亞、沙特阿拉伯、伊朗等多個國家的技術人員積極參與其中。

董少靈分析,這一波生成式AI是對生產力、生產關係的系統性重塑,也是對人類理解智能、理解人、理解自己的一個重塑,是一場啓蒙運動+工業革命。未來應用層的繁榮是必然,會有非常多有價值的應用出現,甚至是未曾涉及的空白領域,並且成功率不會低,可能更多需要的是耐心。

近幾年,基於AIGC技術的產品不斷涌向市場,AI繪圖模型成爲最爲普遍的一種。而在這個領域裡,Midjourney 和 Stable Diffusion 是業內兩大龍頭,Flux、Imagen 3也盡顯優勢。

誰能坐上“AI生圖”第一把交椅?羣雄逐鹿之下,兔展智能近期推出了全球售價最貴的視覺大模型驅動產品——AnyReal,一張圖售價可達100元。

這一大膽嘗試的背後,是其對技術的篤定。“AnyReal是全球第一款可以把物體的三維一致性、光影、材質、透視關係正確生成的視覺模型驅動的AI產品,可能是繼Midjourney和Stable Diffusion之後,全球第三款可能成爲爆款的產品。”談及未來,董少靈表示將繼續深耕,“十年繼往開來,我們要把公司從H5時代演化的所有數字內容的生產線,與AI視覺底層模型做深度融合,爭取儘快推出AI驅動的系列數字內容生產產品。”

在不斷擴大商業版圖的同時,兔展智能也頗受資本市場青睞。2023年上半年,兔展智能完成D+輪融資。

“公司2014年在北大宿舍創立,當時僅靠H5製作平臺,半年就獲客600萬。創立十年來,我們完成了10輪融資,正在進行第11輪、12輪、13輪融資。”董少靈表示,公司趕上了第四次工業革命浪潮,“AI是對社會無孔不入的、本質上的改造,已經成爲社會發展的新引擎。在這樣巨大的生產力革命面前,激發了很多大膽資本、耐心資本的投資熱情,我們公司也受益於此”。

據悉,2015年兔展智能找到對標企業Adobe,決定再現內容工具延展到營銷雲的發展邏輯。隨後兔展智能從一個最早的H5工具逐漸成長爲內容引擎和營銷雲平臺,爲企業提供一站式營銷服務。目前,產品成爲中國銀行、平安集團、中國農業銀行、招商銀行、中信建投證券、泰康集團、華潤三九、東阿阿膠等衆多頭部企業的重要選項。

面對如今生成式AI的浪潮,兔展智能更多的是“扎硬寨,打呆仗”。董少靈透露,在D+輪融資過程中,公司就向當時的一批投資人表達,核心方向是要非常篤定地“All in視覺模型”。在此基礎上,公司致力於開發具有本土特色的視覺模型,即將我國特有的核心產業數據融入視覺模型,使其實際應用效果在某些領域表現出遠超同行的優勢,更好地賦能本土產業發展。

他特別談到,粵港澳大灣區在AIGC領域發展具有強大優勢。

一方面,大灣區作爲中國製造業的核心區域,擁有紮實的產業基礎和高質量的數據資源,這爲我們的視覺模型提供了超越國際競爭對手的關鍵支撐。另一方面,得益於區域內完整的產業鏈和大量的專業人才,AI在實際應用中的持續優化和迭代得到了有力保障。這些得天獨厚的條件,使粵港澳大灣區在擁抱人工智能的浪潮中能夠佔據先機。

南方財經全媒體記者注意到,在兔展智能所獲得的數輪融資中,不乏招商局、深創投、投控東海、越秀產業基金等頭部投資機構,且部分機構是結緣於2023粵港澳大灣區文化產業投資大會(簡稱“文投大會”)。面對今年11月20日即將召開的文投大會,董少靈表示期待:“去年我們結識了很多在文化投資領域卓有建樹的投資機構,今年我們會繼續參加,希望借這個平臺,繼續與在文化和科技交叉領域投資的機構進一步產生有效的信息互換,期待未來能達成更多的合作。”