Sora登場對AIGC意味着什麼?

OpenAI2月16日凌晨發佈“王炸”文生視頻大模型Sora,再次引爆科技圈。在OpenAI官網分享的演示視頻中,Sora可以直接輸出有多個角色、多種場景和運鏡的畫面。這對比一年前 AI 生成的視頻,簡直是天差地別,其視頻長度方面就“碾壓”同行。

方正證券分析師鄭震湘領導的團隊在題爲《AI巨輪滾滾向前》報告中直言,文生視頻大模型Sora震撼登場,AIGC新時代已至。Sora完美繼承DALL·E 3的畫質和遵循指令能力,並利用了GPT擴寫,具備超長生成時間(60s)、單視頻多角度鏡頭、理解物理世界三大突出優勢:

方正證券在報告中指出,英偉達正式發佈Chat With RTX,AI加速普及,通用人工智能時代也正加速來臨。在高性能AI處理器的加持下,AI+N類終端的時代浪潮已至,AI改變的不只是 PC 與手機,科技賦能將全方位滲透,消費電子也將迎來全新的增長機遇:

報告稱,核心公司業務進展近況進一步印證了現階段塊發展兩個核心要素:AI方向的持續產品迭代、龐大的國產化算力需求。預計在AI 算力需求高景氣的背景下,國內AI算力產業鏈將在2024年迎來更加快速的發展。

AIGC 新時代已至

方正證券在報告中指出,從Runway、Pika 到 Sora,文生視頻大模型頻出,視頻長度從表情包長度的3s、4s 到主流短視頻長度的60s,模型對物理世界的理解愈加接近現實,已具備強大的商業化落地價值,創作內容產業革命來臨,AIGC 新時代已至:

報告稱,Sora震撼效果的原因主要有:1)訓練端:基於 Transformer 架構的擴散模型,降維並通過Patche 進行訓練;採樣的靈活性與獨特的訓練路徑(原始 尺寸、時長訓練);利用DALL·E 3 re-captioning 功能,給訓練用的視頻素材都加上高質量文本描述;2)輸入端:利用 GPT 先將用戶輸入的提示詞精準詳盡擴寫,再將擴寫後的提示詞交給 Sora:

方正證券認爲,AI大模型的發展正不斷加速AGI通用人工智能的到來,縱觀整個AI產業鏈,硬件和軟件的配合才能更好地實現多種終端應用的價值化落地,可以預見的是,未來的 AI 時代又是生產力的爆發式革命:

方正證券認爲,手機、MR、機器人等新品迭出,諸多新品亮相,AI終端時代來臨。英偉達、AMD、高通分別推出GeForceRTX 40 SUPER 系列、銳龍8000G 系列、驍龍XR2+ Gen 2 等高性能處理器,性能水平實現躍升,助力AI加速滲透PC、汽車、智能家居等終端場景:

報告指出,MR爲AI最佳落地終端,高度賦能MR 內容與硬件,泛社交、B 端應用拓展也擁有想象空間:

方正證券認爲,英偉達以及AMD等核心公司的業務進展近況進一步印證了現階段板塊發展兩個核心要素:AI方向的持續產品迭代、龐大的算力需求:

報告稱,AI浪潮也在推動光模塊、交換機配套升級 :

本文主要來源於方正證券報告《AI 專題:AI 巨輪滾滾向前》分析師:鄭震湘(S1220523080004)佘凌星(S1220523070005)鍾琳(S1220523070006)劉嘉元(S1220523080001)華爾街見聞有刪節