發佈即開源:智譜AI最新視頻模型支持10秒60幀4K畫質,還自帶音效

11月8日,智譜AI清影迎來升級,發佈最新版視頻模型CogVideoX v1.5。升級後的清影在複雜提示詞理解等方面的能力得到提升,能夠生成10秒、4k、60幀超高清畫質,同時支持任意比例圖像生成視頻,可以一次性生成4個視頻。

智譜也同步發佈了音效模型CogSound和音樂模型CogMusic,可以生成與畫面匹配的音效,音效功能將在本月上線公測。

新模型發佈後,智譜也宣佈將CogVideoX v1.5進行開源,相比於原有模型,CogVideoX v1.5包含5/10秒、768P、16幀視頻生成能力,I2V模型支持任意尺寸比例,大幅提升圖生視頻質量及複雜語義理解。

智譜AI表示,真正的智能一定是多模態的,因此希望智譜多模態大模型家族能進一步提高大模型的應用和工具能力,未來還將與視覺中國等合作,基於更豐富的視覺內容產出更好的AI生成視頻工具。(澎湃新聞記者 秦盛)