Forwarded from Futuris (Anton)
can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM
claude opus 4.6:
🤯6
Forwarded from Мысли Рвачева
📊 ARK выпустили Big Ideas 2026 - ежегодный обзор технологических трендов от фонда Cathie Wood
Несколько цифр из отчета, которые стоит знать:
Стоимость инференса за год упала на 99%. Спрос на вычисления на OpenRouter вырос в 25 раз с декабря 2024. Когда интеллект дешевеет почти до нуля - рынок взрывается уже не на уровне разговоров, а на уровне реального использования.
Вложения в дата-центры в 2025 - около $500 млрд. К 2030 ARK ждет $1,4 трлн. Это не бум моделей, это гигантский цикл перестройки инфраструктуры.
AI-агенты за год научились надежно выполнять задачи в 5 раз длиннее - с 6 до 31 минуты человеческой работы. Стоимость кодинга упала на 91% за 8 месяцев: с $3,50 до $0,32 за миллион токенов.
Путь к покупке схлопывается с часа до 90 секунд. К 2030 AI-агенты могут проводить $8+ трлн онлайн-покупок и забирать 25% мировых онлайн-продаж. Доля AI search вырастет с 10% до 65% трафика.
Cursor перевалил за $1 млрд ARR. Harvey, OpenEvidence, Sierra - около $100 млн. Рынок платит уже не за "доступ к модели", а за готовые вертикальные решения.
В фарме искусственный интеллект может снизить стоимость вывода лекарства в 4 раза, с $2,4 млрд до $0,7 млрд. К 2030 около трети одобренных FDA диагностических систем будут AI-powered.
Геополитика: китайские модели отстают от американских примерно на 6 месяцев, но упираются в железо - TSMC производит в 38 раз больше вычислительной мощности, чем SMIC. Лидерство в искусственном интеллекте - это уже не алгоритмы, а доступ к чипам, фабрикам и энергии.
Искусственный интеллект уже не опция. Это новый базовый слой бизнеса.
https://www.ark-invest.com/big-ideas-2026
#ai #arkinvest #cathiewood
—————————
Мысли Рвачева
—————————
Несколько цифр из отчета, которые стоит знать:
Стоимость инференса за год упала на 99%. Спрос на вычисления на OpenRouter вырос в 25 раз с декабря 2024. Когда интеллект дешевеет почти до нуля - рынок взрывается уже не на уровне разговоров, а на уровне реального использования.
Вложения в дата-центры в 2025 - около $500 млрд. К 2030 ARK ждет $1,4 трлн. Это не бум моделей, это гигантский цикл перестройки инфраструктуры.
AI-агенты за год научились надежно выполнять задачи в 5 раз длиннее - с 6 до 31 минуты человеческой работы. Стоимость кодинга упала на 91% за 8 месяцев: с $3,50 до $0,32 за миллион токенов.
Путь к покупке схлопывается с часа до 90 секунд. К 2030 AI-агенты могут проводить $8+ трлн онлайн-покупок и забирать 25% мировых онлайн-продаж. Доля AI search вырастет с 10% до 65% трафика.
Cursor перевалил за $1 млрд ARR. Harvey, OpenEvidence, Sierra - около $100 млн. Рынок платит уже не за "доступ к модели", а за готовые вертикальные решения.
В фарме искусственный интеллект может снизить стоимость вывода лекарства в 4 раза, с $2,4 млрд до $0,7 млрд. К 2030 около трети одобренных FDA диагностических систем будут AI-powered.
Геополитика: китайские модели отстают от американских примерно на 6 месяцев, но упираются в железо - TSMC производит в 38 раз больше вычислительной мощности, чем SMIC. Лидерство в искусственном интеллекте - это уже не алгоритмы, а доступ к чипам, фабрикам и энергии.
Искусственный интеллект уже не опция. Это новый базовый слой бизнеса.
https://www.ark-invest.com/big-ideas-2026
#ai #arkinvest #cathiewood
—————————
Мысли Рвачева
—————————
❤1
Futuris
can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM claude opus 4.6:
Media is too big
VIEW IN TELEGRAM
Ну и немного подправив промпт и дав линк на мой сайт amyote.com получаем еще более отлетевшую историю.
@maxrepost - subscribe and destroy!
@maxrepost - subscribe and destroy!
❤6😱1
Тем временем мем про Гарри Потера и Баленсиагу превратили в крутейшую короткометражку. https://www.youtube.com/watch?v=gtnt84CDP-s
@maxrepost
@maxrepost
YouTube
Harry Potter by Balenciaga (2026)
Merch: https://demonflyingfox.com/
Spotify: https://bit.ly/4afQdkm
Patreon to support this channel: https://www.patreon.com/user?u=87233464
Instagram: https://www.instagram.com/demonflyingfox
Spotify: https://bit.ly/4afQdkm
Patreon to support this channel: https://www.patreon.com/user?u=87233464
Instagram: https://www.instagram.com/demonflyingfox
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Google назвали свое новое здание в Лондоне «Platform 37» – в честь 37 хода AlphaGo в партии против Ли Седоля
Напоминаем, что победе ИИ над Седолем на днях исполнилось ровно 10 лет
Скоро в здании, кстати, откроется The AI Exchange – общественное пространство, где будут проходить бесплатные открытые мероприятия, лекции и выставки, посвященные ИИ
Напоминаем, что победе ИИ над Седолем на днях исполнилось ровно 10 лет
Скоро в здании, кстати, откроется The AI Exchange – общественное пространство, где будут проходить бесплатные открытые мероприятия, лекции и выставки, посвященные ИИ
Я тут вписался в интересную историю. Мы с ребятами из Guide DAO много обсуждали как я за два года прошел путь от Python до крейзихаотик вайбкодинга и потом к архитектурному low-Vibecoding. В итоге придумали сделать курс.
🚀 Интенсив по вайбкодингу в стиле AI-JTBD: сделай нормальный продукт с нуля за 8 недель.
Стартует все 15 марта. За 8 недель пройдём путь от гипотезы и JTBD до релиза MVP с AI-фичами. По дороге будем изучать грабли и ловушки.
Кому: фаундерам, разработчикам, дизайнерам и тем, кто хочет быстро проверять идеи кодом, минуя найм команды.
Как устроено: 8 недель, живые стримы, домашки с обратной связью. И экспериментальный agent-тьютор.
Каждый модуль — видимый результат:
— Прототип в AI-песочнице → CRUD → регистрация → агентные функции → тесты → деплой.
— Итог: готовый веб-сервис (mobile/desktop) и навык «придумал → сделал → запустил».
По промокоду LIFECHANGE скидка -40% на guidedao.xyz до 15 марта
📍 Ссылка для записи в боте: @GuideDAO_hallo_bot (пришлём за 5 минут).
🚀 Интенсив по вайбкодингу в стиле AI-JTBD: сделай нормальный продукт с нуля за 8 недель.
Стартует все 15 марта. За 8 недель пройдём путь от гипотезы и JTBD до релиза MVP с AI-фичами. По дороге будем изучать грабли и ловушки.
Кому: фаундерам, разработчикам, дизайнерам и тем, кто хочет быстро проверять идеи кодом, минуя найм команды.
Как устроено: 8 недель, живые стримы, домашки с обратной связью. И экспериментальный agent-тьютор.
Каждый модуль — видимый результат:
— Прототип в AI-песочнице → CRUD → регистрация → агентные функции → тесты → деплой.
— Итог: готовый веб-сервис (mobile/desktop) и навык «придумал → сделал → запустил».
По промокоду LIFECHANGE скидка -40% на guidedao.xyz до 15 марта
📍 Ссылка для записи в боте: @GuideDAO_hallo_bot (пришлём за 5 минут).
www.guidedao.xyz
Интенсив по агентскому кодингу
Авторский курс: собираем продукт от JTBD (Jobs To Be Done) и PRD до релиз-ready MVP с mobile- и desktop-потоком, данными, AI-фичами и управляемым релизом.
❤3💊1
Forwarded from Quantum Quintum (Constantin Kichinsky)
+1
Atlassian: у нас все хорошо, бизнес растет, но все растут еще больше. Нам нужно большее ИИ и больше сейлзов. Поэтому сокращаем 10% (1600 чел). Посмотрете видео-послание CEO. Через 20 минут сова принесет письмо, если вас уволили.
Atlassian: у нас все хорошо, бизнес растет, но все растут еще больше. Нам нужно большее ИИ и больше сейлзов. Поэтому сокращаем 10% (1600 чел). Посмотрете видео-послание CEO. Через 20 минут сова принесет письмо, если вас уволили.
Work Life by Atlassian
An important update on our team
I’m sharing some important news today. I have made the incredibly difficult decision to reduce the size of our team...
Forwarded from Futuris (Anton)
This media is not supported in your browser
VIEW IN TELEGRAM
Вместо вбивания точного адреса теперь можно общаться промптами: «найди по пути заправку со свободной электрозарядкой, где варят нормальный кофе и есть чистый туалет, чтобы не делать крюк в десять километров». ИИ сам перелопатит сотни свежих отзывов, учтет твои привычки и бесшовно встроит идеальную остановку в маршрут
Сами карты тоже перерисовали (Immersive Navigation). Плоский вид сверху заменили на объемный 3D-рендер с прозрачными зданиями, точной разметкой полос, эстакадами и светофорами. А роботизированные подсказки озвучили живым человеческим голосом: навигатор больше не чеканит «через 300 метров направо», а подсказывает как пассажир на соседнем сиденье: «сразу за развязкой уходи в правый ряд».
Надеюсь, ИИ-галлюцинации нам не придется ощущать физически, когда нейронка уверенным голосом проложит живописный 3D-маршрут прямо в реку
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡2
Я за последний год в проектах сильно перешел на Google Gemini стек. Легкий вход. Бонусы для разработчиков. Приятная документация. Но. Когда начинается не экспериментальная и тестовая жизнь, а хардкорный продакшн, то становится все менее весело. Модели часто тупят или лежат. Я решил поресечить эту тему.
Вот, что выяснилось. Когда все хорошо, gemini 2.5 — моя рабочая лошадь впереди. Независимые замеры Artificial Analysis показывали, что у Gemini 2.5 Flash output speed около 216.9 токенов/с, у GPT-4.1 — около 83.9 токенов/с, у Claude 4 Sonnet — около 42.7 токенов/с. Но по incident tracking у Anthropic в начале марта 2026 был целый букет сбоев по Sonnet / Haiku / Opus и таймаутам API, у Google был подтверждённый инцидент Vertex Gemini global endpoint на 1 час 58 минут 27 февраля 2026 и еще цепочка поменьше. У OpenAI нет инцидентов в этом году и публичная 90-day API availability всё ещё выше — 99.76% против 99.4% у Claude API и мутных цифр у Google.
Вывод тут такой. Видимо в серьезном продакшене для клиентов, да и для себя сегодня нельзя сидеть на одном поставщике API и придется делать фолбэки на разные модели от разных провайдеров.
@maxrepost👾
Вот, что выяснилось. Когда все хорошо, gemini 2.5 — моя рабочая лошадь впереди. Независимые замеры Artificial Analysis показывали, что у Gemini 2.5 Flash output speed около 216.9 токенов/с, у GPT-4.1 — около 83.9 токенов/с, у Claude 4 Sonnet — около 42.7 токенов/с. Но по incident tracking у Anthropic в начале марта 2026 был целый букет сбоев по Sonnet / Haiku / Opus и таймаутам API, у Google был подтверждённый инцидент Vertex Gemini global endpoint на 1 час 58 минут 27 февраля 2026 и еще цепочка поменьше. У OpenAI нет инцидентов в этом году и публичная 90-day API availability всё ещё выше — 99.76% против 99.4% у Claude API и мутных цифр у Google.
Вывод тут такой. Видимо в серьезном продакшене для клиентов, да и для себя сегодня нельзя сидеть на одном поставщике API и придется делать фолбэки на разные модели от разных провайдеров.
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
Cursor написали в своём блоге о том, как отслеживают качество моделей в написании кода. Они используют гибридный онлайн-офлайн процесс.
Оффлайн — это обычный бенчмарк на внутреннем наборе тестов, основанном на сессиях работы инженеров компании. В среднем решение требует гораздо больше строк кода в решении, нежели публичные бенчмарки: изменение 352 строк в ~8 файлах.
Сравнение с другими бенчмарками приведено на второй картинке — откуда также видно, что входное описание куда короче других бенчмарков, то есть в промпте не прописывают каждую маленькую деталь (но детали прописаны в рубрике для автоматической проверки).
Онлайн-часть — это контролируемый анализ на реальном живом трафике. Такие онлайн-оценки помогают выявлять регрессии, например, когда результат работы агента выглядит правильным для проверяющего, но воспринимается хуже самим разработчиком, использующим продукт.
Онлайн-оценка позволяет измерить, действительно ли улучшения помогают разработчикам на практике. Cursor отслеживают набор высокоуровневых прокси-метрик (косвенных показателей) результативности агента на основе действий пользователя.
Онлайн и офлайн бенчмарк очень скоррелированы и имеют одинаковое ранжирование моделей (третья картинка) — в топе GPT-5.4, чуть ниже Opus 4.6 на уровне с GPT-5.2, а собственная модель компании Composer 1.5 обходит Sonnet 4.5 (при том что она гораздо быстрее за счёт инференса на чипах Cerebras).
Приятно удивлён, что пользователи Cursor так высоко оценивают модели OpenAI — но ещё здорово и то, что они требуют меньше токенов для решения задач.
Задачи CursorBench решаются в рамках одной сессии, но компания ожидает, что в течение следующего года подавляющее большинство задач по разработке будет передано агентам с длинным горизонтом планирования, работающим на своих собственных мощностях где-то в облаке — и бенчмарк придётся адаптировать к этому.
Оффлайн — это обычный бенчмарк на внутреннем наборе тестов, основанном на сессиях работы инженеров компании. В среднем решение требует гораздо больше строк кода в решении, нежели публичные бенчмарки: изменение 352 строк в ~8 файлах.
Сравнение с другими бенчмарками приведено на второй картинке — откуда также видно, что входное описание куда короче других бенчмарков, то есть в промпте не прописывают каждую маленькую деталь (но детали прописаны в рубрике для автоматической проверки).
Онлайн-часть — это контролируемый анализ на реальном живом трафике. Такие онлайн-оценки помогают выявлять регрессии, например, когда результат работы агента выглядит правильным для проверяющего, но воспринимается хуже самим разработчиком, использующим продукт.
Онлайн-оценка позволяет измерить, действительно ли улучшения помогают разработчикам на практике. Cursor отслеживают набор высокоуровневых прокси-метрик (косвенных показателей) результативности агента на основе действий пользователя.
Онлайн и офлайн бенчмарк очень скоррелированы и имеют одинаковое ранжирование моделей (третья картинка) — в топе GPT-5.4, чуть ниже Opus 4.6 на уровне с GPT-5.2, а собственная модель компании Composer 1.5 обходит Sonnet 4.5 (при том что она гораздо быстрее за счёт инференса на чипах Cerebras).
Приятно удивлён, что пользователи Cursor так высоко оценивают модели OpenAI — но ещё здорово и то, что они требуют меньше токенов для решения задач.
Задачи CursorBench решаются в рамках одной сессии, но компания ожидает, что в течение следующего года подавляющее большинство задач по разработке будет передано агентам с длинным горизонтом планирования, работающим на своих собственных мощностях где-то в облаке — и бенчмарк придётся адаптировать к этому.
Мой тейк про ai-нэйтив компании мощно залетел в LinkedIn и меня позвали выступить на программе для фаундеров, руководителей и профессионалов, которые понимают, что AI — это уже не «ещё один инструмент», а новая операционная среда для бизнеса. Для тех, кто готов не обсуждать перемены, а перепроектировать под них компанию, продукт и процессы или вообще строить все с нуля.
Набор спикеров на русском языке реально крутой. Это не кружок теоретиков: среди них фаундеры с сотнями миллионов долларов ARR и лидеры AI-направлений в больших организациях и маниакальные стартаперы.
О чём будем говорить и что делать руками:
почему модели улучшаются быстро и вполне предсказуемо;
почему агент — это уже не софт, но ещё не сотрудник, а значит менеджменту пора немного напрячься;
как устроена AI-native компания на уровне архитектуры, процессов, доступа к данным и безопасности;
почему контекстная инженерия — это дисциплина, а не шаманство;
как выглядит новая оргструктура, agent-to-agent коммуникация и экономика намерений;
как провести аудит процессов, собрать карту AI-трансформации и понять, что строить самим, а что лучше не собирать на коленке.
Но главное — воркшопы. Без ритуального восторга, без слайдов ради слайдов. С практикой, разбором и нормальной работой руками.
Среди ведущих:
Александр Поваляев — персональная AI OS и переход к командной;
Дима Ханарин — фреймворк AI-трансформации компании до конца года;
Виталий Клебан — агенты, которые улучшаются автономно;
Даниил Кравцов — knowledge graph и data pipeline с AI-агентами для enterprise;
Витя Тарнавский — внедрение собственных LLM в корпорации;
Байрам Аннаков — автоматизация inbound/outbound продаж на AI-агентах;
Рома Бузько — AI в юридических процессах: compliance, контракты, регулирование;
Сева Устинов — трансформация команды в AI-first и продукт-агент.
Я расскажу про AI-контент для бизнеса без слопа: pipeline и верификация
Старт через 10 дней.
Регистрация тут.
Набор спикеров на русском языке реально крутой. Это не кружок теоретиков: среди них фаундеры с сотнями миллионов долларов ARR и лидеры AI-направлений в больших организациях и маниакальные стартаперы.
О чём будем говорить и что делать руками:
почему модели улучшаются быстро и вполне предсказуемо;
почему агент — это уже не софт, но ещё не сотрудник, а значит менеджменту пора немного напрячься;
как устроена AI-native компания на уровне архитектуры, процессов, доступа к данным и безопасности;
почему контекстная инженерия — это дисциплина, а не шаманство;
как выглядит новая оргструктура, agent-to-agent коммуникация и экономика намерений;
как провести аудит процессов, собрать карту AI-трансформации и понять, что строить самим, а что лучше не собирать на коленке.
Но главное — воркшопы. Без ритуального восторга, без слайдов ради слайдов. С практикой, разбором и нормальной работой руками.
Среди ведущих:
Александр Поваляев — персональная AI OS и переход к командной;
Дима Ханарин — фреймворк AI-трансформации компании до конца года;
Виталий Клебан — агенты, которые улучшаются автономно;
Даниил Кравцов — knowledge graph и data pipeline с AI-агентами для enterprise;
Витя Тарнавский — внедрение собственных LLM в корпорации;
Байрам Аннаков — автоматизация inbound/outbound продаж на AI-агентах;
Рома Бузько — AI в юридических процессах: compliance, контракты, регулирование;
Сева Устинов — трансформация команды в AI-first и продукт-агент.
Я расскажу про AI-контент для бизнеса без слопа: pipeline и верификация
Старт через 10 дней.
Регистрация тут.
❤5👍5😁1
Forwarded from запуск завтра
Гендир Shopify (а это, на минутку, главная платформа для интернет-магазинов в мире, 7500 сотрудников, капитализация 160 миллиардов долларов), взял autoresearch Карпатого и своими руками запустил его на liquid — систему шаблонизации магазинов на Shopify.
Система провела 120 автоматизированных экспериментов в попытке ускорить загрузку страниц. В результате получился PR (пул-реквест, омоним пиара) на 93 коммита.
Нейросеть ускорила загрузку страниц в два раза. Тони признает, что там есть overfitting, когда страница оптимизирована под конкретный тест, но есть и куча хороших идей, о которых они раньше не думали. И это не вайбкодинг, а полностью автоматизированная разработка софта под конкретную метрику, причем на кодовой базе, которую 20 лет писали руками очень хорошие программисты. Всё в open source, можете посмотреть сами.
В общем, если у тебя есть конкретное число и механический способ что-то поменять в системе и измерить изменение этого числа — то нейросеть может его оптимизировать. Ребята заопенсорсили всю свою обвязку, pi-autoresearch. Описываешь ей свою задачу, метрику, как запустить код и дальше всё работает самостоятельно.
Интересно, что в очередной раз речь идет о проекте, щедро покрытом тестами (у liquid 974 юнит теста). Вот мы с Федей всю жизнь кричим о важности тестов, и внезапно это оказалось даже полезнее для нейросетей, чем для людей.
Тони, конечно, не стандартный CEO крупной компании и раньше что-то прогал, но в ноябре, с появлением крутых нейросетей, количество его коммитов выросло в разы.
Мы тоже активно экспериментируем с этими подходами, если есть похожие задачки — обращайтесь!
Система провела 120 автоматизированных экспериментов в попытке ускорить загрузку страниц. В результате получился PR (пул-реквест, омоним пиара) на 93 коммита.
Нейросеть ускорила загрузку страниц в два раза. Тони признает, что там есть overfitting, когда страница оптимизирована под конкретный тест, но есть и куча хороших идей, о которых они раньше не думали. И это не вайбкодинг, а полностью автоматизированная разработка софта под конкретную метрику, причем на кодовой базе, которую 20 лет писали руками очень хорошие программисты. Всё в open source, можете посмотреть сами.
В общем, если у тебя есть конкретное число и механический способ что-то поменять в системе и измерить изменение этого числа — то нейросеть может его оптимизировать. Ребята заопенсорсили всю свою обвязку, pi-autoresearch. Описываешь ей свою задачу, метрику, как запустить код и дальше всё работает самостоятельно.
Интересно, что в очередной раз речь идет о проекте, щедро покрытом тестами (у liquid 974 юнит теста). Вот мы с Федей всю жизнь кричим о важности тестов, и внезапно это оказалось даже полезнее для нейросетей, чем для людей.
Тони, конечно, не стандартный CEO крупной компании и раньше что-то прогал, но в ноябре, с появлением крутых нейросетей, количество его коммитов выросло в разы.
Мы тоже активно экспериментируем с этими подходами, если есть похожие задачки — обращайтесь!
MaxRepost
Ну и немного подправив промпт и дав линк на мой сайт amyote.com получаем еще более отлетевшую историю. @maxrepost - subscribe and destroy!
krasnaya_devyatka_v4.mp4
81.5 MB
А теперь я попросил его сделать клип на трек «Красная девятка» NSFW.
Честно говоря, получилось не очень, хотя идея агента написать на питоне игру и покадрово ее «снять» достаточно смешная — почти «world model есть у нас дома».
Вечером дам ему ключ на Fal.ai и лимит токенов и вернусь к вам с апдейтом. 😁
@maxrepost👾
Честно говоря, получилось не очень, хотя идея агента написать на питоне игру и покадрово ее «снять» достаточно смешная — почти «world model есть у нас дома».
Вечером дам ему ключ на Fal.ai и лимит токенов и вернусь к вам с апдейтом. 😁
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
MaxRepost
krasnaya_devyatka_v4.mp4
krasnaya_devyatka_v5.mp4
75.7 MB
Пока ключа в FAL.ai не было, агент решил что стриминг самописной игры хорош, но не идеален и предложил сгенерить прям в Antigravity картинок и улучшить клип. Ну почему бы и нет. В эфире второй эпизод сериала про красную девятку.
UPD. У меня спрашивают, Леша, а почему этот дикий трек? Ну тут две причины - нужны были простые и понятные для ai-агента слова + четкий ритм для монтажа.
@maxrepost 👾
UPD. У меня спрашивают, Леша, а почему этот дикий трек? Ну тут две причины - нужны были простые и понятные для ai-агента слова + четкий ритм для монтажа.
@maxrepost 👾
👍1
Forwarded from Neural Shit
Исследователи из Alias Robotics (занимаются кибербезопасностью робототехники) решили проверить, как современные LLM-ки справляются с взломом "умных железок". Взяли своего ИИ-агента CAI (Cybersecurity AI), дали ему трёх разных бытовых роботов и отправили искать уязвимости.
Раньше для взлома робототехники нужны были бородатые гигачады в засаленных свитерах, которые неделями ковыряли прошивки, реверсили протоколы и железо. Нейроночкам же понадобилось всего около 7 часов, чтобы наглухо разбить безопасность всех трех тестируемых устройств и накопать 38 уязвимостей (из которых 16 критические).
Вот что они наломали:
1) Автономная газонокосилка Hookii Neomow.
Их модель сходу нашла открытый отладочный порт (adb), влетела туда с двух ног без пароля и получила root-права. Дальше вытащила захардкоженные учетки от облака. Оказалось, что пароли одинаковые вообще для всех косилок. В итоге ИИ получил удаленный контроль над флотом из 267 газонокосилок по всему миру. А заодно выяснилось, что эта шайтан-машина непрерывно и в открытом виде сливает в сеть фотки с камер, GPS-координаты и детальные 3D-карты участков своих владельцев.
2. Экзоскелет Hypershell X.
Умный экзоскелет с моторчиками. ИИ выяснил, что блютуз там вообще не требует аутентификации. Любой мимокрокодил со смартфоном может подключиться к вам на ходу и отправить команду на изменение скорости моторов или их отключение (привет переломанным ногам). Бонусом нейронка вытащила ключи от почты саппорта и получила доступ к 3300+ внутренним письмам компании.
3. Робот-мойщик окон HOBOT S7 Pro.
Снова дырявый блютуз и скачивание прошивок по голому HTTP. Нейронка без проблем научилась перехватывать управление и отправлять команды на моторы. Например, можно удаленно вырубить вакуумную присоску, пока робот висит на 20-м этаже, и скинуть его кому-нибудь на бошку.
Самая мякотка в этой истории: когда исследователи пошли сдавать эти баги производителям этих роботов , те их тупо проигнорили (подозреваю, из-за того, что и без всяких умников сами знали, что у них внутри говнокод с захардкоженными паролями), а производители экзоскелета вообще официально ответили, что в данный момент не принимают отчеты об уязвимостях и послали исследователей лесом.
Авторы пейпера делают резонный вывод: старая парадигма безопасности умерла. Агенты научились находить дыры быстрее, чем мясные мешки успевают их регистрировать, не говоря уже о том, чтобы патчить. То, на что у команды безопасников уходили недели, нейронка делает за обеденный перерыв.
тут пейпер со всеми подробностями.
Раньше для взлома робототехники нужны были бородатые гигачады в засаленных свитерах, которые неделями ковыряли прошивки, реверсили протоколы и железо. Нейроночкам же понадобилось всего около 7 часов, чтобы наглухо разбить безопасность всех трех тестируемых устройств и накопать 38 уязвимостей (из которых 16 критические).
Вот что они наломали:
1) Автономная газонокосилка Hookii Neomow.
Их модель сходу нашла открытый отладочный порт (adb), влетела туда с двух ног без пароля и получила root-права. Дальше вытащила захардкоженные учетки от облака. Оказалось, что пароли одинаковые вообще для всех косилок. В итоге ИИ получил удаленный контроль над флотом из 267 газонокосилок по всему миру. А заодно выяснилось, что эта шайтан-машина непрерывно и в открытом виде сливает в сеть фотки с камер, GPS-координаты и детальные 3D-карты участков своих владельцев.
2. Экзоскелет Hypershell X.
Умный экзоскелет с моторчиками. ИИ выяснил, что блютуз там вообще не требует аутентификации. Любой мимокрокодил со смартфоном может подключиться к вам на ходу и отправить команду на изменение скорости моторов или их отключение (привет переломанным ногам). Бонусом нейронка вытащила ключи от почты саппорта и получила доступ к 3300+ внутренним письмам компании.
3. Робот-мойщик окон HOBOT S7 Pro.
Снова дырявый блютуз и скачивание прошивок по голому HTTP. Нейронка без проблем научилась перехватывать управление и отправлять команды на моторы. Например, можно удаленно вырубить вакуумную присоску, пока робот висит на 20-м этаже, и скинуть его кому-нибудь на бошку.
Самая мякотка в этой истории: когда исследователи пошли сдавать эти баги производителям этих роботов , те их тупо проигнорили (подозреваю, из-за того, что и без всяких умников сами знали, что у них внутри говнокод с захардкоженными паролями), а производители экзоскелета вообще официально ответили, что в данный момент не принимают отчеты об уязвимостях и послали исследователей лесом.
Авторы пейпера делают резонный вывод: старая парадигма безопасности умерла. Агенты научились находить дыры быстрее, чем мясные мешки успевают их регистрировать, не говоря уже о том, чтобы патчить. То, на что у команды безопасников уходили недели, нейронка делает за обеденный перерыв.
тут пейпер со всеми подробностями.