OpenAI公开了大模型o3-mini的推理思维链
- +1 你赞过了
2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。
推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应,允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误,并提高其推理能力。
OpenAI在一篇文章中表示,该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”,并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本,具有更深入的推理能力和更详细的思维过程,但代价是反应时间较慢。
在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要,而不是完整的推理;该公司表示,这是为了“在速度和准确性之间提供一个平衡的权衡”,尽管它过去也提到“竞争优势”是决定的一个因素。
然而,由于DeepSeek的开源R1展示了其反应背后的整个过程,OpenAI决定将该过程公布。在更新中,“模型的原始(思维链)仍然隐藏,因为它很难理解”,但以一种“易于阅读”的方式呈现。
新的、更深入的推理总结将经过后处理步骤,简化任何过于复杂的解释,删除任何“不安全”的推理解释,并将其翻译成用户的母语。
OpenAI的首席产品官Kevin Weil表示:“展示所有的思维链会带来竞争的升华,但我们也知道人们需要它,所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。
最新资讯
热门视频
新品评测