🚀 OpenAI 推出 sCM 模型,采样速度提升 50 倍
#OpenAI #sCM #模型 #采样速度 #扩散模型 #训练稳定性 #可扩展性 #一致性蒸馏 #AI内容 #高效生成
据 PANews 报道,OpenAI 公告推出全新 sCM(简化一致性模型),基于简化的连续时间一致性模型,提供更高的训练稳定性和可扩展性。
sCM 仅需两步采样即可生成与领先扩散模型相当的样本质量,速度提升约 50 倍。传统扩散模型需几十到上百步。
在 ImageNet 512x512 数据集上,OpenAI 训练了 1.5 亿参数的 sCM,生成单个样本仅需 0.11 秒。sCM 基于预训练扩散模型,并通过一致性蒸馏技术优化。
OpenAI 表示,sCM 的进步为高效实时生成 AI 内容开辟了新可能,将持续推进该领域的发展。
#OpenAI #sCM #模型 #采样速度 #扩散模型 #训练稳定性 #可扩展性 #一致性蒸馏 #AI内容 #高效生成
🚀 OpenAI新技术提升模型对抗鲁棒性
#OpenAI #对抗鲁棒性 #模型 #推理时间 #算力资源 #实验 #攻击方法
据Odaily星球日报报道,今天凌晨 2 点,OpenAI 发布了一项新技术研究,通过增加推理时间和算力资源,大幅提升模型的对抗鲁棒性。
与传统对抗训练样本方法不同,OpenAI 的新方法无需专门对抗训练或提前了解攻击形式。通过增加推理时间和算力资源,模型可更好利用推理能力,表现出更强鲁棒性。
OpenAI 在 o1-preview 和 o1-mini 模型上进行综合实验,成功抵御 Many-shot、Soft Token Attack、Human Red-teaming Attack 等多种攻击方法。
#OpenAI #对抗鲁棒性 #模型 #推理时间 #算力资源 #实验 #攻击方法
🚀 微软 CEO 纳德拉:DeepSeek R1 模型可通过 Azure AI Foundry 获取
#微软 #CEO #纳德拉 #DeepSeek #AzureAI #AI #模型 #GitHub #Copilot #创新 #推理 #效率 #硬件 #性价比
据 ChainCatcher 报道,微软 CEO 纳德拉在电话会上表示,DeepSeek R1 模型现已可通过微软的 AI 平台 Azure AI Foundry 和 GitHub 获取,并将很快在 Copilot+ 电脑上运行。
纳德拉指出,DeepSeek 具有创新性,AI 成本下降是趋势。他提到,缩放定律在预训练和推理时间计算中不断积累,AI 训练和推理效率显著提高。推理方面,每代硬件性价比提高 2 倍以上,每代模型性价比提高 10 倍以上。
#微软 #CEO #纳德拉 #DeepSeek #AzureAI #AI #模型 #GitHub #Copilot #创新 #推理 #效率 #硬件 #性价比
🚀 Meta AI 负责人称当前模型缺乏人类智能特征
#MetaAI #YannLeCun #人工智能 #模型 #人类智能 #推理能力 #复杂行动计划 #持久记忆 #检索增强生成 #RAG系统 #VJEPA #认知能力 #人才流失 #Llama模型
据 Cointelegraph 报道,Meta 的 AI 负责人 Yann LeCun 表示,当前的人工智能模型缺乏人类智能的四个关键特征:理解物理世界、持久记忆、推理能力和复杂行动计划能力。他指出,现有的大型语言模型未达到这一标准,需要改变训练方式。Meta 正在尝试使用检索增强生成(RAG)系统来改进模型输出,并推出了 V-JEPA 模型。LeCun 认为基于世界的模型更具优势,因为它们能在真实场景中训练,具备更高的认知能力。与此同时,Meta 的 AI 团队正在经历人才流失,许多原 Llama 模型的研究人员已离职。
#MetaAI #YannLeCun #人工智能 #模型 #人类智能 #推理能力 #复杂行动计划 #持久记忆 #检索增强生成 #RAG系统 #VJEPA #认知能力 #人才流失 #Llama模型