智譜AI加入視頻生成大戰
作者 | 劉寶丹
編輯 | 黃昱
AI大模型的能力已經從語言卷向多模態。繼快手和愛詩科技發佈視頻生成工具後,智譜AI也亮出了自己的大招。
7月26日,智譜AI CEO張鵬在公司Open Day上宣佈,AI生成視頻產品清影(Ying)正式上線,只需30秒就可以生成6秒視頻,而且是1440x960清晰度的高精度視頻。
目前,清影已經在清言App、PC和小程序端同步上線,所有C端用戶都能通過清影免費體驗到AI文生視頻、圖生視頻能力。同時,清影API也同步上線大模型開放平臺bigmodel.cn供企業和開發者調用。
對智譜AI來說,清影的推出無異於在C端市場又增添了一枚重要棋子,這也是智譜AI成立五年來對多模態能力的一次檢驗。
智譜AI成立於2019年,由清華大學知識工程實驗室(KEG)技術成果轉化而來,是國內最早研發大模型的企業之一。公司的願景是實現通用人工智能(AGI),而多模態是必經之路。
會上,張鵬表示,“爲什麼要做多模態這件事,視頻生成並不是孤立來看,是放到整個技術和產品發展路線當中來看,我們認爲它是AGI必須走的路徑。”
公司很早就確定要做TO B業務,對於C端戰略,張鵬年初表示,TO C也會去做,但目的比較明確,把閉環做起來,給未來也留下一個可能性。他判斷,TO C應用可能未來也是一個要爆發的點。
顯然,清影就是這一戰略思維下的產品。
在C端層面,智譜AI已經打造了清言APP,這是一個人工智能助手,幫用戶解決工作學習生活當中的實際問題,做生產力提效。根據公司定位,清影不會單獨成爲一個獨立產品去商業化落地,它是智譜清言產品打造的視頻創作智能體。
具體來看,用戶輸入一段文字後(Prompt),可以選擇自己想要生成的風格,包括卡通3D、黑白、油畫、電影感等,配上清影自帶的音樂,就可以生成充滿AI想象力的視頻片段。
除了文本生成視頻,清影還可以實現圖片生成視頻,即輸入一張圖片+相應的提示詞,清影大模型將根據提示將圖片轉變爲視頻畫面。
清影在圖生視頻帶來了更多的新玩法,包括表情包梗圖、廣告製作、劇情創作、短視頻創作等。同時,基於清影的“老照片動起來”小程序也會同步上線,只需一步上傳老照片,AI就能讓凝練在舊時光中的照片靈動起來。
隨着清影的上線,國內AIGC賽道將迎來更加激烈的競爭,尤其是在具備多模態能力的C端產品領域。
7月6日,快手宣佈,基於自研的視覺生成大模型產品可靈AI網頁端正式上線,普通用戶可以登錄網站進行功能試用,創作者單次生成的文生視頻時長增加至10s;7月24日,愛詩科技發佈視頻生成產品PixVerse V2,可實現單片段8秒。
MiniMax也公開表示,視頻可能下個月會出來,在星野和海螺AI裡面也可能會有應用場景。華爾街見聞獲悉,月之暗面內部也在做多模態,並且可能很快就會對外公佈進展。
清影上線是一個重要信號,在AI大模型的全球技術迭代中,智譜AI已經亮出了手裡的多模態武器。接下來,清影將接受殘酷的市場考驗,它和清言APP也將朝着殺手級應用更進一步。