一舉發布兩款大模型,字節跳動加入AI視頻生成“戰局”

9月24日,字節跳動旗下火山引擎在深圳舉辦AI創新巡展,一舉發布了兩款視頻生成大模型並首次面向企業市場開啓邀測,正式宣告進軍AI視頻生成領域。與今年2月OpenAI發佈的Sora相同,字節所發佈的的“豆包”大模型只需輸入簡單的提示詞或圖片,一條接近實拍的影視級AI視頻就可自動生成,並且能實現自然連貫的多拍動作和多主體複雜交互。

據瞭解,本次所發佈的模型具體爲豆包視頻生成-PixelDance和豆包視頻生成-Seaweed。除視頻大模型外,字節跳動還發布了豆包音樂大模型、同聲傳譯模型等產品。

據瞭解,豆包大模型原名“雲雀”,在2023年8月通過《生成式人工智能服務管理暫行辦法》備案,是首批能正式上線面向公衆服務的8家大模型之一。2024年5月15日,豆包大模型在火山引擎原動力大會上正式發佈。

自發布以來,豆包大模型發展趨勢向好。據火山引擎總裁譚待透露,5月以來,豆包大模型日均調用量整體呈現爆發式增長。截至今年9月,豆包大模型的日均Tokens(表示和傳遞信息的標識符)調用量超過1.3萬億,整體增長超10倍。除語言模型外,目前豆包文生圖模型日均生成圖片也達到了5000萬張,此外,豆包目前還日均處理語音85萬小時,相當於7萬天的廣播節目播出時長的總和。

值得一提的是,雖然豆包通用模型TPM(每分鐘Tokens)、RPM(每分鐘請求書)達到國內最高標準,但其推理定價卻大幅低於行業價格,這一度掀起了國內大模型領域的降價潮。使得阿里、百度、騰訊等大模型廠商紛紛宣佈對主力模型進行降價,目前降價仍有延續之勢。

今年9月19日,阿里宣佈阿里雲百鍊平臺上的三款通義千問主力模型再次降價,產品的降價幅度在50%至85%之間不等。

對此,譚待在發佈會當天表示:“這樣大幅的降價背後,其實大量的創新應用隨之不斷涌現,這也是幾個行業裡面模型調用量在突飛猛進的關鍵。其他廠商也在跟隨我們的步伐,不斷把模型進行降價,大家共同努力讓應用的生態更加繁榮。”

事實上,自今年2月Open AI推出Sora以來,國內外已有十多家公司發佈或更新視頻生成模型。今年6月,快手發佈可靈大模型,是國內首個對標Sora的視頻生成大模型產品,截至目前已經經歷了9次迭代,今年9月9日,快手還宣佈啓動“可靈AI電影共創計劃”,聯手9位導演使用可靈AI生成9部電影。9月19日,阿里也宣佈通義萬相視頻生成功能上線。通義萬相視頻模型支持最長5秒、每秒30幀、分辨率爲720P的視頻生成。