恆小花:AI文生視頻如何改變未來

美國人工智能公司OpenAI於16日又發佈了全新的生成式人工智能模型Sora,它能夠通過文本指令創建最長達60秒的視頻,其逼真的視覺效果讓它在一夜之間“刷屏”,全球諸多媒體都對其冠以“顛覆性”的美名,甚至有網友感嘆“視頻行業全都要被洗牌了”。相關專家17日接受《環球時報》記者採訪時表示,短期來看,Sora確實會對影視等行業帶來顯著影響,但我們也不應神化其作用,長期來看,需要用心製作的作品,依舊很難僅用“芯”完成。

“人類願賭服輸”

目前OpenAI還沒有發佈Sora的公開使用版本,但已經發布的40多個演示視頻中包含有細節拉滿的場景、複雜的攝像機運鏡以及多個充滿情感的角色。OpenAI宣稱,Sora可以理解物體在物理世界中如何存在,並準確地解釋道具並生成引人注目的角色來表達充滿活力的情感。例如它可以根據文字描述“在東京街頭,一名時髦女士穿梭在充滿溫暖霓虹燈光和動感城市標誌的街道上”,生成一段包含有多鏡頭的高清晰視頻,包括從大街景切入對女士臉部表情的特寫,以及潮溼的街道地面反射霓虹燈的光影效果。這些視頻的真實度令人爲之驚歎,就連特斯拉CEO馬斯克也在社交媒體上對此表示“人類願賭服輸”。

Sora的出現也引發了國內許多業界人士的擔憂,“中美AI領域差距進一步拉大”成爲Sora問世後的伴生話題。360集團創始人周鴻禕認爲,“OpenAI訓練的Sora應該會閱讀大量視頻。一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖”,因此Sora的出現可能意味着通用人工智能“真的就不遠了”,“不是10年20年的問題,可能一兩年很快就可以實現”。他表示,儘管國內大模型發展水平表面看已經接近GPT3.5,但實際上跟4.0比還有一年半的差距。從現在來看,OpenAI手上除了GPT5之外,可能還有一些“秘密武器”沒有亮出來。“中國和美國的AI差距可能不但沒有縮小,反而在加大。”

此外,在人機協同和人機融合領域,中美技術能力旗鼓相當。“這也是美國三番五次與中國開展人工智能技術對話的原因之一,雙方實力相當,纔有對話的意願,美國方面也很擔心我們在人機協同上實現重大突破,從而佔據領先地位。”