☰

失意的年終直播：OpenAI的內外交困

2024年12月,OpenAI啓動了一場爲期12天的新品發佈會。這場持續近兩週的產品發佈,吸引了全球科技行業的密切關注。

這12天裡,OpenAI逐一推出了多項技術更新。首個亮相的是完整推理模型o1,該模型在性能指標上有明顯變化:思考速度較預覽版提升約50%,處理複雜問題時的錯誤率降低34%,同時新增了圖像識別等多模態輸入支持功能。

隨後發佈的產品包括強化微調技術、文生視頻工具Sora和協作平臺Canvas。其中,Sora可生成最長20秒、1080p分辨率的視頻內容;Canvas則集成了寫作輔助和編程環境功能。經過強化微調的o1-mini模型在測試通過率上提升了82%。

在發佈會的最後階段,OpenAI推出了新一代AI模型o3及其精簡版o3-mini。o3在多項專業測試中展現出其性能:在GPQADiamond博士級科學考試中達到87.7%的準確率,在美國AIME數學競賽中獲得96.7分,在Codeforces編程平臺上獲得2727分的評分。

市場期待的高光時刻卻未如期而至。在這場持續12天的發佈會中,OpenAI始終未曾提及外界翹首以盼的GPT-5。而作爲OpenAI的重磅產品,文生視頻工具Sora的表現也未能完全兌現此前的期望。此外，不速之客Google突然宣佈推出其最新AI模型，則讓這場年末的科技盛會更添幾分戲劇性。

Google反擊：OpenAI的意外年終劇情

曾經被業界視爲AI領域當之無愧領跑者的OpenAI，這一次卻在最引以爲傲的兩大王牌產品上連遭掣肘。而給OpenAI帶來這場"驚喜"的，正是此前因"動作遲緩"而備受爭議的老對手 - Google。

OpenAI直播進行到第三天，萬衆期待的Sora終於正式亮相。每月200美元的ChatGPT Pro會員可享用這款文生視頻工具，似乎一切都在按部就班地進行。然而，與年初首次官宣時引發的轟動效應相比，這次的Sora表現卻顯得黯淡無光。最長20秒、最高1080p的視頻生成能力，在已有Runway、可靈、海螺AI等諸多競品的市場上，不僅未能激起太大波瀾，反倒讓不少用戶發出了失望的聲音。

就在OpenAI試圖力挽狂瀾之際，Google選擇了最巧妙的時機發起反擊。12月17日，一款名爲Veo2的文生視頻產品橫空出世。雖然當前Veo2只能生成8秒、720p的視頻，但Google給出了一個極具誘惑力的承諾：未來將支持2分鐘以上的4K分辨率視頻生成。更具意味的是，Google CEO皮查伊在社交媒體上特意強調Veo2"對現實世界的物理與運動有更好的理解"，這番話背後的鋒芒，直指Sora當前飽受詬病的技術短板。

市場的反應格外耐人尋味。Sora發佈後，用戶討論熱度平平，評測中頻頻出現"生物運動變形"、"手部動作不自然"、"文字亂碼"等老問題的身影。反觀Veo2，其流暢的生物運動、豐富自然的表情變化以及穩定的長鏡頭表現，卻收穫了一片讚譽之聲。這種尷尬的反差，最終迫使OpenAI不得不在聖誕假期期間推出"無限制訪問"的臨時政策，試圖重新引起市場關注。

Google的反擊不僅如此。就在OpenAI直播進入倒計時的第二天，Google又打出了一記重拳-發佈Gemini 2.0 Flash Thinking。這個以思維鏈可視化爲特色的多模態推理模型，明顯是衝着OpenAI的o1模型而來。根據獨立基準測試網站lmarena.ai的初步評估，Gemini 2.0 Flash Thinking的整體表現已經超越了o1預覽版，排名躍居第一。

在這場年末的AI角力中，曾經在人工智能領域起步較晚的Google，似乎找到了與OpenAI正面較量的最佳時機。這一回合的交鋒，不僅關乎兩家科技巨頭的產品博弈，更預示着AI領域競爭格局可能即將迎來一次重大轉折。

GPT-5爲何遲遲未至？

而在這場12天的直播盛會中，一個顯著的缺席者引發了業界的諸多猜測 - 外界最爲期待的GPT-5始終未曾露面。這背後，是其代號爲"Orion"（獵戶座）的項目所面臨的重重困境。

這個已經開發超過18個月的新一代AI項目，正在經歷着遠比外界想象更爲艱難的陣痛。據知情人士透露，OpenAI的最大投資方微軟原本期待在2024年年中看到這款新模型的身影。然而現實卻給了所有人一記重擊：在至少兩次大規模訓練中，每一次都耗時數月，消耗了海量數據資源，卻始終未能達到研究人員預期的成果。

這場充滿未知的探索之旅，從一開始就佈滿荊棘。2023年年中，OpenAI對獵戶座新設計展開首次實戰測試，這個被稱爲"Arrakis"的項目卻暴露出了令人憂心的問題：訓練進度異常緩慢，預示着更大規模訓練可能帶來天文數字般的成本。即便在最理想的情況下，獵戶座相較現有模型的性能提升，也難以證明其高昂的運營成本是否值得-僅六個月的訓練週期，計算成本就可能高達約5億美元。

正如OpenAI CEO奧特曼所言，如果GPT-4的訓練成本就已超過1億美元，那麼未來的AI模型訓練費用將輕鬆突破10億美元大關。在這種情況下，每一次失敗的訓練都會帶來巨大的壓力，帶來的不僅是鉅額損失，更是難以承受的心理打擊。

而就在OpenAI爲GPT-5絞盡腦汁之際，外部壓力卻接踵而至。Google不僅在這場馬拉松直播中頻頻出手，展現出令人意外的精準打擊能力，馬斯克的xAI更是在活動結束後立即宣佈完成60億美元C輪融資，將該公司的總融資額推至120億美元。這些動作無不在暗示：AI領域的競爭遠比想象中更加激烈。

這場本應在歡快氛圍中結束2024年的營銷活動，卻在某種程度上成爲了OpenAI這一年際遇的隱喻：它依然優秀，卻已從神壇迴歸人間。隨着競爭對手的不斷崛起，2025年的AI賽道註定將迎來更多挑戰。對OpenAI而言，如何在保持技術領先的同時突破發展瓶頸，或許是一個值得深思的命題。（思維財經出品）■

失意的年終直播：OpenAI的內外交困

相關資訊