失意的年終直播:OpenAI的內外交困
2024年12月,OpenAI啓動了一場爲期12天的新品發佈會。這場持續近兩週的產品發佈,吸引了全球科技行業的密切關注。
這12天裡,OpenAI逐一推出了多項技術更新。首個亮相的是完整推理模型o1,該模型在性能指標上有明顯變化:思考速度較預覽版提升約50%,處理複雜問題時的錯誤率降低34%,同時新增了圖像識別等多模態輸入支持功能。
隨後發佈的產品包括強化微調技術、文生視頻工具Sora和協作平臺Canvas。其中,Sora可生成最長20秒、1080p分辨率的視頻內容;Canvas則集成了寫作輔助和編程環境功能。經過強化微調的o1-mini模型在測試通過率上提升了82%。
在發佈會的最後階段,OpenAI推出了新一代AI模型o3及其精簡版o3-mini。o3在多項專業測試中展現出其性能:在GPQADiamond博士級科學考試中達到87.7%的準確率,在美國AIME數學競賽中獲得96.7分,在Codeforces編程平臺上獲得2727分的評分。
市場期待的高光時刻卻未如期而至。在這場持續12天的發佈會中,OpenAI始終未曾提及外界翹首以盼的GPT-5。而作爲OpenAI的重磅產品,文生視頻工具Sora的表現也未能完全兌現此前的期望。此外,不速之客Google突然宣佈推出其最新AI模型,則讓這場年末的科技盛會更添幾分戲劇性。
Google反擊:OpenAI的意外年終劇情
曾經被業界視爲AI領域當之無愧領跑者的OpenAI,這一次卻在最引以爲傲的兩大王牌產品上連遭掣肘。而給OpenAI帶來這場"驚喜"的,正是此前因"動作遲緩"而備受爭議的老對手 - Google。
OpenAI直播進行到第三天,萬衆期待的Sora終於正式亮相。每月200美元的ChatGPT Pro會員可享用這款文生視頻工具,似乎一切都在按部就班地進行。然而,與年初首次官宣時引發的轟動效應相比,這次的Sora表現卻顯得黯淡無光。最長20秒、最高1080p的視頻生成能力,在已有Runway、可靈、海螺AI等諸多競品的市場上,不僅未能激起太大波瀾,反倒讓不少用戶發出了失望的聲音。
就在OpenAI試圖力挽狂瀾之際,Google選擇了最巧妙的時機發起反擊。12月17日,一款名爲Veo2的文生視頻產品橫空出世。雖然當前Veo2只能生成8秒、720p的視頻,但Google給出了一個極具誘惑力的承諾:未來將支持2分鐘以上的4K分辨率視頻生成。更具意味的是,Google CEO皮查伊在社交媒體上特意強調Veo2"對現實世界的物理與運動有更好的理解",這番話背後的鋒芒,直指Sora當前飽受詬病的技術短板。
市場的反應格外耐人尋味。Sora發佈後,用戶討論熱度平平,評測中頻頻出現"生物運動變形"、"手部動作不自然"、"文字亂碼"等老問題的身影。反觀Veo2,其流暢的生物運動、豐富自然的表情變化以及穩定的長鏡頭表現,卻收穫了一片讚譽之聲。這種尷尬的反差,最終迫使OpenAI不得不在聖誕假期期間推出"無限制訪問"的臨時政策,試圖重新引起市場關注。
Google的反擊不僅如此。就在OpenAI直播進入倒計時的第二天,Google又打出了一記重拳-發佈Gemini 2.0 Flash Thinking。這個以思維鏈可視化爲特色的多模態推理模型,明顯是衝着OpenAI的o1模型而來。根據獨立基準測試網站lmarena.ai的初步評估,Gemini 2.0 Flash Thinking的整體表現已經超越了o1預覽版,排名躍居第一。
在這場年末的AI角力中,曾經在人工智能領域起步較晚的Google,似乎找到了與OpenAI正面較量的最佳時機。這一回合的交鋒,不僅關乎兩家科技巨頭的產品博弈,更預示着AI領域競爭格局可能即將迎來一次重大轉折。
GPT-5爲何遲遲未至?
而在這場12天的直播盛會中,一個顯著的缺席者引發了業界的諸多猜測 - 外界最爲期待的GPT-5始終未曾露面。這背後,是其代號爲"Orion"(獵戶座)的項目所面臨的重重困境。
這個已經開發超過18個月的新一代AI項目,正在經歷着遠比外界想象更爲艱難的陣痛。據知情人士透露,OpenAI的最大投資方微軟原本期待在2024年年中看到這款新模型的身影。然而現實卻給了所有人一記重擊:在至少兩次大規模訓練中,每一次都耗時數月,消耗了海量數據資源,卻始終未能達到研究人員預期的成果。
這場充滿未知的探索之旅,從一開始就佈滿荊棘。2023年年中,OpenAI對獵戶座新設計展開首次實戰測試,這個被稱爲"Arrakis"的項目卻暴露出了令人憂心的問題:訓練進度異常緩慢,預示着更大規模訓練可能帶來天文數字般的成本。即便在最理想的情況下,獵戶座相較現有模型的性能提升,也難以證明其高昂的運營成本是否值得-僅六個月的訓練週期,計算成本就可能高達約5億美元。
正如OpenAI CEO奧特曼所言,如果GPT-4的訓練成本就已超過1億美元,那麼未來的AI模型訓練費用將輕鬆突破10億美元大關。在這種情況下,每一次失敗的訓練都會帶來巨大的壓力,帶來的不僅是鉅額損失,更是難以承受的心理打擊。
而就在OpenAI爲GPT-5絞盡腦汁之際,外部壓力卻接踵而至。Google不僅在這場馬拉松直播中頻頻出手,展現出令人意外的精準打擊能力,馬斯克的xAI更是在活動結束後立即宣佈完成60億美元C輪融資,將該公司的總融資額推至120億美元。這些動作無不在暗示:AI領域的競爭遠比想象中更加激烈。
這場本應在歡快氛圍中結束2024年的營銷活動,卻在某種程度上成爲了OpenAI這一年際遇的隱喻:它依然優秀,卻已從神壇迴歸人間。隨着競爭對手的不斷崛起,2025年的AI賽道註定將迎來更多挑戰。對OpenAI而言,如何在保持技術領先的同時突破發展瓶頸,或許是一個值得深思的命題。(思維財經出品)■