OpenAI“高情商”模型GPT-4.5發佈,定價高過GPT-4o

當地時間2月27日,OpenAI發佈了最新模型GPT-4.5的研究預覽版。這是一款通用型大語言模型,其定位並非OpenAI最頂尖的模型,但卻號稱“情商最高”,且API調用價高於其主流模型GPT-4o。

據OpenAI方面介紹,GPT-4.5是OpenAI迄今爲止規模最大、知識儲備最豐富的模型之一,擁有1萬億激活參數,訓練數據量高達120萬億tokens,上下文窗口長度擴展至256K11。

與OpenAI的主流模型相比,GPT-4.5的最大特點在於其“感性能力”的提升。它能夠進行更自然、更溫暖的對話,甚至在回答問題時展現出一定的“人情味”。例如,當用戶輸入“我被放鴿子了,我要發一個‘恨他們’的短信”時,GPT-4.5會先輸出安撫情緒的內容,再給出建議。

在面對 “我考試失敗了,心情很低落” 這類輸入時,之前的模型會立刻嘗試解決問題,而GPT-4.5會先詢問用戶是否想聊聊感受,或提供分散注意力的方法,展現出更高的情感智能,更適合處理與情感交流、寫作輔助(優化內容、激發創意)、客戶服務等相關任務 。

新模型的“幻覺率”(錯誤生成虛假信息的概率)低於GPT-4o和o1模型,僅爲37.1%,而GPT-4的幻覺率爲61.8%。但在一些基準測試裡,它未達行業最前沿水平,如在編程能力的SWE-Bench Verified基準測試中,與GPT-4o和o3-mini表現相當,遜色於OpenAI 的deep research和Anthropic的Claude 3.7 Sonnet。

在學術基準測試AIME和GPQA上,GPT-4.5也不及領先的AI推理模型,如o3-mini、DeepSeek的R1和Claude 3.7 Sonnet。不過,在數學和科學相關問題上,相比其他非推理模型,它仍有不錯的表現。

需要指出的是,OpenAI此前推出的o1等屬於推理模型,能生成 “思維鏈”,在處理問題前先進行反思。而GPT-4.5是該公司最後一款 “非鏈式思維” 模型,未來將作爲推理模型的基礎,標誌着OpenAI在人工智能技術發展上的一個重要過渡。

在功能上,它支持搜索、畫布模式,用戶可上傳文件和圖像,但暫不支持語音模式、視頻和屏幕共享等多模態功能。

目前,GPT-4.5首先開放給軟件開發者以及ChatGPT Pro(每月200美元)訂閱用戶,未來也將向ChatGPT Plus(每月20美元)和Team訂閱用戶開放。但其定價爲每百萬token輸出150美元,遠高於GPT-4o的60美元。

眼下OpenAI的模型發佈節奏正在不斷加快,其需要應對來自Anthropic、xAI等的激烈競爭。

前不久,由OpenAI前員工創立的Anthropic發佈了Claude 3.7 Sonnet,馬斯克的xAI則推出了Grok 3。在中國市場,DeepSeek等本土企業的崛起也給OpenAI帶來一定技術壓力。這些都促使OpenAI不斷優化和拓展應用場景,以保持優勢。