姍姍來遲的Sora,一來就亂殺了。

磨磨蹭蹭了快一年, OpenAI 終於捨得把 Sora 這盤菜端上來了。

這不,咱們還在做夢的時候, Sora 就已經那能用了, 登錄網址 Sora.com ,訂閱會員搶先體驗。

反正從昨天晚上折騰到今天,國內外各大媒體瘋狂報道,有不少老哥已經把 Sora 生成的視頻發到了網上,那叫一個熱鬧。

可能哥幾個也好奇,這個傳說中的 Sora 到底有多少斤兩,跟國內的視頻生成模型相比,誰又會更勝一籌?

本來吧,這個問題世超可以在第一時間替大夥兒解答,會員賬號早早就薅到手了。結果誰能想到, Sora 的服務器被擠爆了,現在進都進不去。。。

不過說實在的,光是發佈會上對 Sora 具體功能的展示,硬貨就夠多的了。

所以今天世超就先拿發佈會上的 “ 餐前甜點 ” ,給大夥兒開開胃,看看 Sora 跟之前咱們體驗過的那些視頻生成模型到底有啥區別。

首先在產品形態上,世超覺得, Sora 就更接近 一個擁有完整工作流程的生產力工具。

這次發佈的 Sora Turbo 支持文字、圖片和視頻三種生成方式,能夠生成最高分辨率 1080p 、時長 20 秒的視頻,支持寬屏、豎屏和方形比例。

但這些東西其實都挺常規的,最讓世超覺得驚豔的地方,還是 Sora 把 AI 生成的能力融入到了視頻創作的每一個環節中。

就比如 Storyboard 故事板功能,大夥兒可以簡單理解成,給一段視頻添加不同的分鏡。

咱直接來看官方的例子,一共 440 幀的視頻,前 114 幀的場景 prompt 是 “ 一片廣闊的紅色景觀,遠處停靠着一艘宇宙飛船 ” 。

接着可以繼續發揮想象力,把 114-324 幀的場景變成 “ 從宇宙飛船內部向外看,一位太空牛仔站在畫面中央 ” 。

最後用 “ 宇航員眼睛的特寫鏡頭,眼睛被針織面料製成的面罩框柱 ” 的 prompt ,結束這段視頻。

這些 “ 分鏡 ” 在哪個時間點添加,添加什麼內容,都可以由用戶自己決定。

而在故事板的基礎上,咱們又可以把生成好的視頻用 Re-cut ( 在線重新剪輯 )功能,繼續調整一波。

這種剪輯,跟咱們理解的這裁一段那剪一截還不太一樣。在視頻的時間軸上,你可以把不滿意的部分都剪掉,剩下來的活兒就可以扔給 Re-cut 功能,讓它幫你把空白的地方再重新補全。

這還沒完啊。

Sora 還有一個 Remix 功能,那才叫一個酷炫。

用 prompt“ 毛茸茸的猛獁在沙漠中行走 ” 生成一段視頻,看起來也沒啥特別的對吧。

有意思的地方來了,如果你想把視頻裡的猛獁象給換了,比如換成機器人, ok , Remix 功能就能派上用場了。

硅基生物無痕替換碳基生物,而且從替換後的視頻效果裡也能看出來,機器人的步態、沙漠背景,幾乎沒有出現太大的畸變, 畫面穩定性和主體一致性整體都在線。

當然這只是官方給的案例,咱們也別太侷限,大膽點兒把沙漠變成大海,也不是不行。

另外, Sora 的發佈會上還介紹了 Loop ( 循環 )和 Blend ( 視頻融合 )兩個功能。

一個能讓視頻實現首尾視頻幀的絲滑銜接,讓視頻一直循環。

還有一個,則是把兩個視頻無縫合併成一個視頻。

怎麼個無縫法呢,用雪花飄落和花瓣飄落的視頻作爲例子,大夥兒一看就明白了。

除此之外, Sora 還有個 Style-Presets 的功能,其實說白了就是換換風格。同樣都是兩頭猛獁象在雪地行走,但你可以把初始版換成黑白電影,或者紙板風和膠片檔案風。

相信看到這兒,大夥兒應該多少能品出來, Sora 跟現在市面上很多視頻生成應用的區別了吧?

咱沒有拉踩的意思,也沒有非要分個高下。單純從客觀地角度來說, Sora 已經做到了一個視頻生成模型理想狀態下,相對完整的產品形態。

生成功能,不過是 Sora 最最基本的一塊磚,沒有了不行,但由一塊塊磚搭起來的大廈,肯定會更引人注目。

而之前咱們上手體驗到的一些視頻生成模型,大多隻專注在生成效果這個單一維度上,魔改玩玩還可以,但要當真正的生產力工具,還差點意思。

其次,在最直觀的生成效果上, Sora 雖說有瑕疵,但總體上瑕不掩瑜。

看看外網老哥們在 X 上發的視頻,世超是真饞了。

先用 Midjourney 生成圖片,再把 prompt 餵給 Sora ,這清晰度,這穩定性,老人臉上的皺紋都不帶動一下的,還有眼神裡透出來的 “ 嚴肅和焦慮 ” ,也讓 Sora 悟到了。

prompt :鏡頭聚焦在茂密茂盛的森林中一位飽經風霜的老人。他的臉上沾滿了藍漆和泥巴,深深的皺紋表明他一生都在荒野中度過。背景是一片模糊的綠色和棕色,捕捉到了未馴化環境的本質。這名男子嚴肅而焦慮的目光暗示着一種生存、堅韌和與自然的深厚聯繫,爲場景增添了一種神秘感和緊張感。

還有這個金毛衝浪,狗狗重心往下壓的時候,衝浪板的方向也在跟着往下,而且水面也因爲金毛的這個動作掀起了一陣浪花。

該說不說, Sora 對物理規律的掌握,可比年初的時候好太多了。

等世超能用上了,高低也給咱火鍋也安排一次。

不過,也有一些網友用 Sora 跟咱們國內的視頻生成應用,對比了一把。

同樣的 prompt ,打眼這麼一看真看不出來太大差距,非要說的話,就是 Sora 版的頭髮更柔順一些。

問題是 KLING 免費就能用。。拿這個視頻對比,就顯得開 200 美元 / 月 Sora 會員的有點冤種了。

在一些網友的測試裡, Sora 生成的視頻還會出現手部不夠自然的情況。

包括昨晚的發佈會上, Sora 也小小翻車了一下。

工作人員輸入了 “ 鶴把頭扎進水中,叼起一條小魚 ” 的提示詞,結果視頻中的白鶴,壓根就沒叼到魚。

最後,可能是大夥兒不太關注到的一個點, Sora 對 AI 生成的安全性考慮。

之前不是老有人嚷嚷 AI 爲禍人間,看圖片看視頻,現在都分不清到底是人乾的還是 AI 生成的了。

所以這次 Sora 生成的視頻都帶有 C2PA 元數據, C2PA 咱們之前專門寫文章嘮過,感興趣的差友可以翻出來看看。 它最大的特點就是可以溯源,內容是誰創作的、歷史的修改記錄,這些都會被記錄下來。

總的來說,這次 Sora 的亮相還是帶來了不少驚喜,特別是在產品形態上,視頻創作的完整工作流提供了一個更新的視角。

不是我說,國內視頻生成下一步要往哪卷,應該有方向了吧。 ( 狗頭 )

撰文:西西

編輯:江江&面線

美編:煥妍

圖片、資料來源:

OpenAI、X

部分圖源網絡