OpenAI向第三方開發者開放最強大模型o1

12月18日消息,在爲期12天的假日發佈會進入第9天之際,OpenAI宣佈其最先進的模型o1系列已通過應用程序接口(API)全面向第三方開發者開放。這一發布標誌着開發者向構建先進人工智能應用邁出了重要一步。它也讓開發者能夠將OpenAI的頂尖技術無縫集成到現有的企業級應用或面向消費者的工作流程中。

OpenAI的o1系列模型於2024年9月首次亮相,是該公司推出的“新模型家族”中的首個成員。這不僅意味着對GPT系列大語言模型(LLM)的突破,更引入了全新的“推理”能力。

簡單來說,o1系列模型(包括o1和o1 mini)相比傳統大語言模型,雖然響應時間稍長,但能夠在生成回答時進行自我校驗,確保回答的準確性,從而有效避免“幻覺”現象。OpenAI此前表示,o1模型能夠處理更復雜的任務,甚至包括博士級別的問題,而實際應用的反饋也驗證了這一點。

此前,開發者已可通過o1預覽版構建各種應用,例如“博士導師”或“實驗室助手”。如今,伴隨通過API發佈的生產版o1模型正式上線,其性能得到顯著提升,延遲更低,並新增了多項功能,極大簡化了模型在實際場景中的集成和應用。

大約兩週半前,OpenAI已通過ChatGPT Plus和ChatGPT Pro計劃向消費者開放了o1模型,並增加了對用戶上傳圖像及文件的分析和響應功能。

此外,OpenAI還在今天的發佈會上公佈了對其Realtime API的重大更新,包括價格下調及一種全新的微調方法,賦予開發者更高的模型控制能力。

1. o1模型現已通過API向開發者開放

新版o1模型(版本號:o1-2024-12-17)在複雜且多步推理任務中表現出色。與此前的o1-preview版本相比,該版本在準確性、效率和靈活性方面均實現了顯著提升。

OpenAI表示,新版o1模型在多項基準測試中取得了突破性成績,涵蓋編碼、數學和視覺推理等多個領域。例如,在SWE-bench Verified測試(該基準用於評估模型解決實際軟件問題的能力)中,o1的得分從41.3提升至48.9;而在數學領域的AIME測試中,得分從42大幅躍升至79.2。這些改進使得o1模型成爲優化客戶支持、提升物流管理效率或解決複雜分析問題等場景中的理想工具。

此外,OpenAI爲開發者提供了多項新功能:

· 結構化輸出:允許生成符合自定義格式(如JSON架構)的響應,確保與外部系統交互時保持結果一致性;

· 函數調用:簡化了模型與API及數據庫的連接流程;

· 視覺推理:使模型能夠處理視覺輸入,拓展了製造、科學研究和編程等領域的全新應用場景。

開發者還可以通過新增的reasoning_effort參數對o1模型進行微調。該參數可平衡任務的性能和響應時間,控制模型在任務處理時所投入的計算時間。

2. Realtime API重大更新,爲智能語音/音頻AI助手提供支持

OpenAI同時宣佈對Realtime API進行重大更新,旨在支持低延遲、自然流暢的語音交互體驗,適用於語音助手、實時翻譯工具和虛擬導師等場景。

新增的WebRTC集成爲開發語音應用提供了直接支持,包括音頻流、噪聲抑制和網絡擁塞控制等功能。即使在網絡條件不穩定的情況下,開發者也能以最小的配置輕鬆實現實時功能集成。

在定價方面,OpenAI顯著降低了Realtime API的成本:

· GPT-4o音頻:價格下調60%,每100萬輸入Token費用降至40美元,輸出Token費用降至80美元;

· 緩存音頻輸入:成本降低87.5%,定價爲每100萬輸入Token 2.5美元;

· GPT-4o mini:作爲更小、更經濟高效的模型,每100萬輸入Token費用僅爲10美元,輸出Token費用爲20美元。

此外,GPT-4o mini的文本Token價格也大幅降低,輸入Token的起始價格爲0.60美元,輸出Token的起始價格爲2.40美元。

除了降低成本,OpenAI還爲開發者提供了對Realtime API更高的控制權:

· 併發帶外響應:允許後臺任務(如內容審覈)在不影響用戶體驗的情況下運行;

· 上下文定製:開發者可以根據對話內容定製輸入上下文,並精確控制語音響應的觸發時機,以實現更準確、流暢的交互體驗。

3. 偏好微調提供了新的自定義選項

OpenAI新推出的另一個重要功能是偏好微調,這是一種基於用戶和開發者偏好來定製模型的新方法。

不同於傳統的監督式微調依賴精確的輸入-輸出對,偏好微調採用成對比較的方式,引導模型識別並生成更符合用戶偏好的響應。這種方法在處理主觀性任務時尤其高效,比如摘要生成、創造性寫作,或在語氣和風格至關重要的場景中。

與合作伙伴Rogo AI的早期測試顯示了令人鼓舞的結果。Rogo AI爲金融分析師開發智能助手,測試表明偏好微調在處理複雜、分佈外查詢時,相較於傳統微調方法,顯著提升了模型的表現,將任務準確率提高了5%以上。目前,該功能已應用於GPT-4o-2024-08-06和GPT-4o-mini-2024-07-18版本,並計劃於明年初拓展到更多新模型上。

4. 面向Go和Java開發者的新SDK

爲簡化模型集成,OpenAI正在擴展其官方SDK產品線,推出Go和Java語言的測試版SDK。這些新SDK與現有的Python、Node.js和.NET庫一同,爲開發者提供更多編程環境的支持,使與OpenAI模型的交互更加便捷。

· Go SDK:特別適用於構建可擴展的後端系統,提供高性能和靈活的開發能力;

· Java SDK:專爲企業級應用設計,憑藉強類型支持和成熟生態系統,適配複雜且穩定性要求高的項目。

通過這些更新,OpenAI爲開發者提供了更豐富的工具集,幫助他們構建先進、高度可定製的人工智能應用程序。無論是o1模型在複雜推理任務中的增強,Realtime API的優化,還是偏好微調的推出,OpenAI的最新產品旨在提供更強大的性能和更高的成本效益,助企業不斷拓展人工智能技術的應用邊界。

(小小)