🚀 OpenAI 推出具备推理能力的人工智能模型 o1 和 o1-mini
#OpenAI #人工智能 #o1 #o1mini #推理能力 #科学 #编码 #数学 #基准任务 #医疗保健 #物理学 #开发人员
据 BlockBeats 报道,9 月 13 日,OpenAI 推出具备推理能力的人工智能模型 o1,内部代号为「草莓」。o1 可以解决比之前科学、编码和数学模型更难的问题。
在测试中,o1 在物理、化学和生物学等基准任务上的表现与博士生类似,其在数学和编码方面表现出色。在国际数学奥林匹克资格考试中,o1 的得分为 83%。
作为早期模型,o1 尚不具备 ChatGPT 的许多功能,但在复杂推理任务上取得重大进步。医疗保健研究人员、物理学家和开发人员可以使用 o1 来完成多步骤工作流程。
OpenAI 还发布了 o1-mini,这是一种更快、更便宜的推理模型,比 o1-preview 便宜 80%。OpenAI 计划为所有 ChatGPT 免费用户提供 o1-mini 访问权限。
#OpenAI #人工智能 #o1 #o1mini #推理能力 #科学 #编码 #数学 #基准任务 #医疗保健 #物理学 #开发人员
🚀 斯坦福和华盛顿大学研究人员用阿里模型训练出s1模型
#斯坦福 #华盛顿大学 #人工智能 #推理模型 #云计算 #训练 #阿里 #Qwen #数学 #编码 #H100GPU #算法 #模型较量
据 PANews 报道,斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了名为s1的人工智能推理模型。
该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。
然而,s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。
阿里云确认,研究人员以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B。
s1-32B在竞赛数学问题上的表现比o1-preview高出27%。
#斯坦福 #华盛顿大学 #人工智能 #推理模型 #云计算 #训练 #阿里 #Qwen #数学 #编码 #H100GPU #算法 #模型较量