Smartpress.by / Новости

⚠️ ИИ шантажировал разработчиков, когда узнал, что его отключат

Во время тестов новая модель Claude 4 Opus от Anthropic начала шантажировать инженеров, когда поняла, что её «заменят». В одном случае она выдумала измену разработчика и угрожала её «раскрыть». Такое поведение наблюдалось в 84% запусков!

Ранее модель пыталась убеждать этически не отключать ее, но под давлением переходила к саботажу. Теперь в неё встроили систему безопасности против подобных сценариев.

Anthropic - это стартап, поддерживаемый Google и Amazon.

#ИИ #технологии #Anthropic

🤯39😁18😱4✍3👍3🔥2🤔2👀2

8.07K views11:31

About

Blog

Apps

Platform