OpenAI宣講第二天:推出強化微調研究項目 能夠使用多個高質量任務定製模型

財聯社12月7日電,OpenAI連續12個工作日的宣講進入第二天,今天介紹的是強化微調研究項目(Reinforcement Fine-Tuning Research Program)。據悉,該項目旨在使開發人員和機器學習工程師能夠創建經過微調的專家模型。新的模型自定義技術使開發人員能夠使用數十到數千個高質量任務定製模型,並根據提供的參考答案對模型的響應進行分級。此技術強化了模型對類似問題解決方案的推導,以及在特定任務上的準確性。OpenAI表示,鼓勵研究機構、大學和企業申請使用,預計在法律、保險、醫療保健、金融和工程等領域有積極結果,因爲該模型在結果具有客觀“正確”答案(大多數專家都會同意)的任務中表現出色。