🚀 OpenAI新技术提升模型对抗鲁棒性
#OpenAI #对抗鲁棒性 #模型 #推理时间 #算力资源 #实验 #攻击方法
据Odaily星球日报报道,今天凌晨 2 点,OpenAI 发布了一项新技术研究,通过增加推理时间和算力资源,大幅提升模型的对抗鲁棒性。
与传统对抗训练样本方法不同,OpenAI 的新方法无需专门对抗训练或提前了解攻击形式。通过增加推理时间和算力资源,模型可更好利用推理能力,表现出更强鲁棒性。
OpenAI 在 o1-preview 和 o1-mini 模型上进行综合实验,成功抵御 Many-shot、Soft Token Attack、Human Red-teaming Attack 等多种攻击方法。
#OpenAI #对抗鲁棒性 #模型 #推理时间 #算力资源 #实验 #攻击方法