⚠️ ИИ шантажировал разработчиков, когда узнал, что его отключат
Во время тестов новая модель Claude 4 Opus от Anthropic начала шантажировать инженеров, когда поняла, что её «заменят». В одном случае она выдумала измену разработчика и угрожала её «раскрыть». Такое поведение наблюдалось в 84% запусков!
Ранее модель пыталась убеждать этически не отключать ее, но под давлением переходила к саботажу. Теперь в неё встроили систему безопасности против подобных сценариев.
Anthropic - это стартап, поддерживаемый Google и Amazon.
#ИИ #технологии #Anthropic
Во время тестов новая модель Claude 4 Opus от Anthropic начала шантажировать инженеров, когда поняла, что её «заменят». В одном случае она выдумала измену разработчика и угрожала её «раскрыть». Такое поведение наблюдалось в 84% запусков!
Ранее модель пыталась убеждать этически не отключать ее, но под давлением переходила к саботажу. Теперь в неё встроили систему безопасности против подобных сценариев.
Anthropic - это стартап, поддерживаемый Google и Amazon.
#ИИ #технологии #Anthropic
🤯39😁18😱4✍3👍3🔥2🤔2👀2