OpenAI推出強化微調研究項目 CEO奧特曼稱“今年最大驚喜”快訊
OpenAI的定制模型平臺將支持強化學習,OpenAI推出了強化微調研究項目,強化學習也是OpenAI內部用于訓練自家前沿模型的技術。
【TechWeb】12月7日消息,據外媒報道,AI初創公司OpenAI啟動了為期12天的直播活動。活動首日,推出了完整版(滿血版)o1推理模型,并新增了月費為200美元的ChatGPT Pro訂閱。
直播第二天, OpenAI推出了強化微調研究項目。該項目旨在使開發人員和機器學習工程師能夠創建經過微調的專家模型。
新的模型自定義技術使開發人員能夠使用數十到數千個高質量任務定制模型,并根據提供的參考答案對模型的響應進行分級。此技術強化了模型對類似問題解決方案的推導,以及在特定任務上的準確性。
在OpenAI的演示中,微調后的o1-mini模型得分提高80%,直接反超o1正式版。

據OpenAI介紹,用戶可以綜合運用o1、微調和數據創建定制的小型 o1模型 o1 mini。用戶要做的就是提供數據,然后在強化微調方面,設置一個數據集和一個“評分器”,根據訓練和驗證數據集評估模型的性能,其他工作交給OpenAI。
OpenAI CEO奧特曼在社交平臺發文稱,“效果一級棒,是我2024年最大的驚喜,期待看到人們構建什么!”
OpenAI稱,OpenAI的定制模型平臺將支持強化學習,強化學習也是OpenAI內部用于訓練自家前沿模型的技術,如GPT-4o和o1系列模型。在OpenAi的內測中,強化微調已經在生物化學、安全、法律和醫療保健領域取得成功。
按照OpenAI的計劃,2025年初強化微調將面向公眾發布,目前已對企業、大學和研究院開放申請測試通道。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。