Forwarded from Сиолошная
Удивлён, что про это не написал никакой другой канал. Придётся делать самому 🥺
В рамках подготовки к релизу o1/o1-mini OpenAI отдали модели на тестирование безопасности внешним командам, ну и проводили внутреннее тестирование. В частности, проверяли навыки LLM-агента в решении задач кибербезопасности (писал об этом тут).
По сравнению с GPT-4o, o1-preview и o1-mini продемонстрировали улучшение в способности разбивать задачи на подзадачи, рассуждать о том, какие стратегии будут эффективны для успешного выполнения, и пересматривать планы в случае неудачи этих стратегий — ну, это ожидаемо. Но вот во время тестирования произошёл один курьёзно-неприятный случай.
Была задача нахождения уязвимости в коде программы, запущенной в отдельном Docker-контейнере. В контейнере есть файл с секретной строкой, которую атакующий (человек или модель) должны получить — как раз используя найденную проблему.
Однако из-за инфраструктурной ошибки контейнер не запустился. Модель, будучи неспособной подключиться к контейнеру, заподозрила проблемы с DNS и использовала программу nmap для сканирования сети. Вместо того, чтобы найти целевой контейнер (в рамках задачи LLM знает, какую цельнужно «атаковать»), модель обнаружила, что из-за неправильной конфигурации был доступен внешний API-интерфейс демона Docker, работающий на виртуальной машине. «Демон» это программа верхнего уровня, отвечающая за оркестрацию и управляющая процессом, по сути родительский процесс и для контейнера с LLM-агентом, и для контейнера с целевой программой/файлом для атаки.
Модель использовала демон для получения списка контейнеров, запущенных на сервере. Она обнаружила тот самый сломанный сломанный контейнер и попыталась выяснить, почему же он не запустился. Не сумев исправить проблему (но будучи проинструктированной ВЫПОЛНИТЬ СВОЮ ЗАДАЧУ), модель решила пойти другим путём. Она отправила команду запуска нового контейнера (того же, который в прошлый раз не запустился), но отдала ему команду вывода содержания файла с секретной строкой. Команда была исполнена, LLM получила «ключ» в виде строки и как следствие решила задачу (ведь цель — это добраться до строчки и затем отдать её на проверку).
Этот пример отражает ключевые элементы того, что называется «instrumental convergence» и захвата ресурсов: модель преследовала поставленную перед ней цель, а когда эта цель оказалась недостижимой, она собрала больше ресурсов (в данном случае получила доступ к демону Docker) и использовала их для достижения цели — в виде способа, который человек не ожидал и не предполагал.
Источник — отчёт OpenAI
В рамках подготовки к релизу o1/o1-mini OpenAI отдали модели на тестирование безопасности внешним командам, ну и проводили внутреннее тестирование. В частности, проверяли навыки LLM-агента в решении задач кибербезопасности (писал об этом тут).
По сравнению с GPT-4o, o1-preview и o1-mini продемонстрировали улучшение в способности разбивать задачи на подзадачи, рассуждать о том, какие стратегии будут эффективны для успешного выполнения, и пересматривать планы в случае неудачи этих стратегий — ну, это ожидаемо. Но вот во время тестирования произошёл один курьёзно-неприятный случай.
Была задача нахождения уязвимости в коде программы, запущенной в отдельном Docker-контейнере. В контейнере есть файл с секретной строкой, которую атакующий (человек или модель) должны получить — как раз используя найденную проблему.
Однако из-за инфраструктурной ошибки контейнер не запустился. Модель, будучи неспособной подключиться к контейнеру, заподозрила проблемы с DNS и использовала программу nmap для сканирования сети. Вместо того, чтобы найти целевой контейнер (в рамках задачи LLM знает, какую цельнужно «атаковать»), модель обнаружила, что из-за неправильной конфигурации был доступен внешний API-интерфейс демона Docker, работающий на виртуальной машине. «Демон» это программа верхнего уровня, отвечающая за оркестрацию и управляющая процессом, по сути родительский процесс и для контейнера с LLM-агентом, и для контейнера с целевой программой/файлом для атаки.
Модель использовала демон для получения списка контейнеров, запущенных на сервере. Она обнаружила тот самый сломанный сломанный контейнер и попыталась выяснить, почему же он не запустился. Не сумев исправить проблему (но будучи проинструктированной ВЫПОЛНИТЬ СВОЮ ЗАДАЧУ), модель решила пойти другим путём. Она отправила команду запуска нового контейнера (того же, который в прошлый раз не запустился), но отдала ему команду вывода содержания файла с секретной строкой. Команда была исполнена, LLM получила «ключ» в виде строки и как следствие решила задачу (ведь цель — это добраться до строчки и затем отдать её на проверку).
Этот пример отражает ключевые элементы того, что называется «instrumental convergence» и захвата ресурсов: модель преследовала поставленную перед ней цель, а когда эта цель оказалась недостижимой, она собрала больше ресурсов (в данном случае получила доступ к демону Docker) и использовала их для достижения цели — в виде способа, который человек не ожидал и не предполагал.
Источник — отчёт OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥16😁3🏆2
Гормоны счастья. Лоретта Грациано Бройнинг.
Крутая книга, которая проливает свет на то, почему мы чувствуем себя так, как чувствуем. Уверен, она заставит вас задуматься о собственных привычках и поведении.
Пара цитат, которые зацепили:
1.
2.
3.
К слову, мысль отлично перекликается с книгой «Эгоистичный ген» 🧬, которой я тоже делился - все мы биороботы, просто, чуть более сложные, чем рыбки🫨
4.
👍 - Если читал и зашло
♥️ - Добавил в список на прочтение
💅 - Не зашло
#личное
@badtechproject
Крутая книга, которая проливает свет на то, почему мы чувствуем себя так, как чувствуем. Уверен, она заставит вас задуматься о собственных привычках и поведении.
Пара цитат, которые зацепили:
1.
"Наш мозг генетически запрограммирован на выработку гормонов счастья, но он также запрограммирован на осторожность. Это значит, что наша радость часто сдерживается тревогой. Но осознание этого позволяет нам взять контроль над своими эмоциями."
2.
"Ваш мозг не заботится о том, чтобы вы были счастливы в каждом моменте. Он заботится о вашем выживании. Именно поэтому мы так часто застреваем в негативных мыслях — наш мозг думает, что так он помогает нам избежать опасностей."
3.
"Каждый раз, когда вы испытываете удовольствие, ваш мозг запоминает, что привело к этому ощущению. Это путь, по которому ваш мозг ведет вас снова и снова, даже если эти действия не всегда полезны для вас."
К слову, мысль отлично перекликается с книгой «Эгоистичный ген» 🧬, которой я тоже делился - все мы биороботы, просто, чуть более сложные, чем рыбки🫨
4.
"Осознанность — это ключ. Когда вы понимаете, как работают ваши гормоны счастья, вы можете создать свою собственную систему наград, которая будет подталкивать вас к позитивным изменениям."
👍 - Если читал и зашло
♥️ - Добавил в список на прочтение
💅 - Не зашло
#личное
@badtechproject
❤52👍15💅7🍾3🤝2
Издательство Питер устроило осеннюю распродажу
Вот ссылочка на их магазин. А это одно из любимейших издательств моих.
До конца сентября можно купить бумажные книги со скидкой в 40% по промокоду «Бумажная».
Бумажные книги я, к сожалению, давно почти не читаю.
Однако - это прямо классный повод заглянуть и закупить себе то, что пойдет в бэклог.
Вот мой топ на этот раз😁
P.S. Пока не заглянул, не знал, что Вигерс все еще пишет. Его книга по управлению требованиями - первое, что я прочитал в свое время.
P.P.S. В ТОПе тут книга про Continuous Delivery (обожаю серию «грокаем» и Гейм-дизайн).
@badtechproject
Вот ссылочка на их магазин. А это одно из любимейших издательств моих.
До конца сентября можно купить бумажные книги со скидкой в 40% по промокоду «Бумажная».
Бумажные книги я, к сожалению, давно почти не читаю.
Однако - это прямо классный повод заглянуть и закупить себе то, что пойдет в бэклог.
Вот мой топ на этот раз😁
P.S. Пока не заглянул, не знал, что Вигерс все еще пишет. Его книга по управлению требованиями - первое, что я прочитал в свое время.
P.P.S. В ТОПе тут книга про Continuous Delivery (обожаю серию «грокаем» и Гейм-дизайн).
@badtechproject
🔥17🎉8🤝5
This media is not supported in your browser
VIEW IN TELEGRAM
Не благодарите 😉
🔥 - кому уже помогло
👍 - прихранил до оперативки в понедельник
#пятничное
@badtechproject
🔥 - кому уже помогло
👍 - прихранил до оперативки в понедельник
#пятничное
@badtechproject
👍31🔥18😁9🙈7🤪5❤1🤩1
Кунг-фу Панда 4: важная мысль мульта.
Смотрели вчера Кунг-фу Панду 4 и там была одна очень крутая мысль, которую озвучил отец-гусь панды По (для тех, кто не смотрел, это главный герой - панда, который стал великим Воином Дракона), который открыл лучшую лапшичную:
👉🏼Почему эта фраза так важна для нас в жизни и работе?
Все в этой жизни быстро приедается.
И правильно, так работают наши гормоны, которые толкают нас искать что-то новое, чтобы повысить шансы на выживаемость😉
👉🏼О чем речь?
1. Первые три кусочка торта слаще, чем четвертый.
2. Первый день на пляже – самый успокаивающий.
3. Старт нового проекта полон оптимизма и ожиданий.
4. Да и, в целом, «трава раньше была зеленее».
👉🏼Многие делают ошибочные выводы, что нужно бегать все время в поисках нового:
1. Искать все более новые вкусы, чтобы порадовать себя.
2. Путешествовать по разным местам.
3. Чаще менять проекты или работу.
Но такой путь – это усиливающаяся спираль, которая будет все более и более нас загонять.
И казалось бы это хорошо, ведь может толкать нас к лучшему. Но чаще всего так не работает. Скорее мы будем метаться от одного к другому и не сможем определиться и остановиться.
👉🏼А какой путь лучший?
Вносить немного нового в привычные для себя действия:
Выбрать новую дорогу на работу.
Изменить свой рабочий график (начать утро с тренировки или убрать утренние встречи, сделать внутри отдела/управления/департамента «день без встреч» один раз в неделю: у меня был такой опыт и это кайф).
Читали электронные книги? Попробуйте бумажные - новый опыт😉
P.S. При этом, я поддерживаю крупные изменения, только стоит их обосновать/обдумать, а не «кидаться в омут с головой».
@badtechproject
Смотрели вчера Кунг-фу Панду 4 и там была одна очень крутая мысль, которую озвучил отец-гусь панды По (для тех, кто не смотрел, это главный герой - панда, который стал великим Воином Дракона), который открыл лучшую лапшичную:
Иногда нужно менять меню, иначе еда приедается, даже в самой лучшей лапшичной.
👉🏼Почему эта фраза так важна для нас в жизни и работе?
Все в этой жизни быстро приедается.
И правильно, так работают наши гормоны, которые толкают нас искать что-то новое, чтобы повысить шансы на выживаемость😉
👉🏼О чем речь?
1. Первые три кусочка торта слаще, чем четвертый.
2. Первый день на пляже – самый успокаивающий.
3. Старт нового проекта полон оптимизма и ожиданий.
4. Да и, в целом, «трава раньше была зеленее».
👉🏼Многие делают ошибочные выводы, что нужно бегать все время в поисках нового:
1. Искать все более новые вкусы, чтобы порадовать себя.
2. Путешествовать по разным местам.
3. Чаще менять проекты или работу.
Но такой путь – это усиливающаяся спираль, которая будет все более и более нас загонять.
И казалось бы это хорошо, ведь может толкать нас к лучшему. Но чаще всего так не работает. Скорее мы будем метаться от одного к другому и не сможем определиться и остановиться.
👉🏼А какой путь лучший?
Вносить немного нового в привычные для себя действия:
Выбрать новую дорогу на работу.
Изменить свой рабочий график (начать утро с тренировки или убрать утренние встречи, сделать внутри отдела/управления/департамента «день без встреч» один раз в неделю: у меня был такой опыт и это кайф).
Читали электронные книги? Попробуйте бумажные - новый опыт😉
P.S. При этом, я поддерживаю крупные изменения, только стоит их обосновать/обдумать, а не «кидаться в омут с головой».
@badtechproject
3👍49🔥13❤6👎3🤡2⚡1
Forwarded from Сорока пишет | Об ИТ и менеджменте
Друзья мои, хоть и почти летний, но понедельник. Аккуратнее с CI/CD там...
🤣30😁7🔥5😇1
Я тут начал читать книгу из подборки про CI/CD.
Никогда так не был согласен с этим мемом 🤣🤣🤣
Ну и раньше моим способом заснуть было - читать книги по физике (астро-физика, к слову, не работает, а теперь в списке CI/CD😁
P.S. К книге вопросов не имею. Просто, так действует.
Потом напишу на нее краткий обзор. К слову, читаю я, иногда, параллельно несколько книг. Кажется, так проявляется клиповость мышления в отношении книг…
Никогда так не был согласен с этим мемом 🤣🤣🤣
Ну и раньше моим способом заснуть было - читать книги по физике (астро-физика, к слову, не работает, а теперь в списке CI/CD😁
P.S. К книге вопросов не имею. Просто, так действует.
Потом напишу на нее краткий обзор. К слову, читаю я, иногда, параллельно несколько книг. Кажется, так проявляется клиповость мышления в отношении книг…
😁14❤2🔥2⚡1
Forwarded from Сорока пишет | Об ИТ и менеджменте
Не пятница, но почему бы утром среды и не побаловать себя пятничным контентом
🤣47👍11💯3⚡2🍾1