Data Secrets
Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей…
Goodfire показали, как геометрически выглядит математика внутри LLM
Недавно у них вышло очень занятное исследование, в котором они ввели термин neural geometry и доказали, что нейросети "думают" сложными геометрическими структурами. Мы делали разбор этой статьи вот тут: t.iss.one/data_secrets/9194.
Если кратко, суть в том, что внутреннее пространство моделей организовано в виде многомерных форм, поверхностей и траекторий. Эти многообразия вполне интерпретируемы. Например, дни недели лежат как бы на круге, в циклической структуре.
Сегодня лаба выпустила продолжение исследования: они разобрали, как модель "представляет" числа и совершает над ними операции.
Можно было бы ожидать, что в геометрии модели числа будут лежать на абстрактной числовой прямой или будут закодированы двоично, НО НЕТ: каждое число – это окружности. Каждая окружность соответствует числу по модулю некоторого основания, то есть остатку от деления. Например, число 17 было бы представлено как 1 на окружности по модулю 2, как 2 на окружности по модулю 5 и как 7 на окружности по модулю 10.
И это не что иное, как разложение Фурье! Кто бы мог подумать, что оно обнаружится внутри трансформера.
А когда модели нужно что-то посчитать, активируется целый геометрический калькулятор. Например, нужно сложить два числа. Для этого, на самом деле, решается сразу несколько параллельных задач на разных окружностях. Возмем 6 + 8. Модель отдельно считает: (6 mod 2) + (8 mod 2) = 0, (6 mod 5) + (8 mod 5) = 4, (6 mod 10) + (8 mod 10) = 4, и так далее. Все эти результаты вместе декодируются в число 14.
Это напоминает китайскую теорему об остатках. Древнейший математический трюк, который оказался встроен в нейросети совершенно автономно. Кстати, точно так же модели вычисляют разницу в датах, годах и днях недели.
Красивое😍
Недавно у них вышло очень занятное исследование, в котором они ввели термин neural geometry и доказали, что нейросети "думают" сложными геометрическими структурами. Мы делали разбор этой статьи вот тут: t.iss.one/data_secrets/9194.
Если кратко, суть в том, что внутреннее пространство моделей организовано в виде многомерных форм, поверхностей и траекторий. Эти многообразия вполне интерпретируемы. Например, дни недели лежат как бы на круге, в циклической структуре.
Сегодня лаба выпустила продолжение исследования: они разобрали, как модель "представляет" числа и совершает над ними операции.
Можно было бы ожидать, что в геометрии модели числа будут лежать на абстрактной числовой прямой или будут закодированы двоично, НО НЕТ: каждое число – это окружности. Каждая окружность соответствует числу по модулю некоторого основания, то есть остатку от деления. Например, число 17 было бы представлено как 1 на окружности по модулю 2, как 2 на окружности по модулю 5 и как 7 на окружности по модулю 10.
И это не что иное, как разложение Фурье! Кто бы мог подумать, что оно обнаружится внутри трансформера.
А когда модели нужно что-то посчитать, активируется целый геометрический калькулятор. Например, нужно сложить два числа. Для этого, на самом деле, решается сразу несколько параллельных задач на разных окружностях. Возмем 6 + 8. Модель отдельно считает: (6 mod 2) + (8 mod 2) = 0, (6 mod 5) + (8 mod 5) = 4, (6 mod 10) + (8 mod 10) = 4, и так далее. Все эти результаты вместе декодируются в число 14.
Это напоминает китайскую теорему об остатках. Древнейший математический трюк, который оказался встроен в нейросети совершенно автономно. Кстати, точно так же модели вычисляют разницу в датах, годах и днях недели.
Красивое
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯191🔥70❤51👍14👌6🗿3 2
Microsoft сделали экзамен по вайбкодингу
Они запустили на GitHub сертификацию Agentic AI Developer (GH-600). Это буквально тест на то, насколько вы хороший оркестратор для агентов.
learn.microsoft.com/en-us/credentials/certifications/agentic-ai-developer/
По этой ссылке можно посмотреть, что будет в «билетах» (наверху скрин с общими положениями, а вот тут есть полноценный стади гайд). Есть также список материалов, которые они рекомендуют для подготовки + можно пройти мини-пробник в песочнице.
Сдать экзамен стоит 165$, в итоге вы получите полноценное подтверждение компетенции вайбкодера👩🍳
Они запустили на GitHub сертификацию Agentic AI Developer (GH-600). Это буквально тест на то, насколько вы хороший оркестратор для агентов.
learn.microsoft.com/en-us/credentials/certifications/agentic-ai-developer/
По этой ссылке можно посмотреть, что будет в «билетах» (наверху скрин с общими положениями, а вот тут есть полноценный стади гайд). Есть также список материалов, которые они рекомендуют для подготовки + можно пройти мини-пробник в песочнице.
Сдать экзамен стоит 165$, в итоге вы получите полноценное подтверждение компетенции вайбкодера
Please open Telegram to view this post
VIEW IN TELEGRAM
😁189👍46❤25🔥3🍓3🦄2 2🤨1
«Норникель» заявил о создании первой в России ИИ-системы для проектирования промышленных зданий
Компания разработала систему, которая помогает проектировать объекты от фундамента до кровли и автоматически готовит инженерную документацию. По сути, это мультиагентная ИИ-система для промышленного проектирования, обученная на внутренней базе знаний компании, ГОСТах и СНиПах.
Агенты проводят расчеты, собирают цифровую модель здания, формируют спецификации и проверяют все на соответствие корпоративным стандартам и требованиям законодательства. Финальное решение все равно остается за инженером, но основной объем рутины с человека снимается, и это существенно бустит процесс.
А именно: задания на проектирование создаются на 83% быстрее, цифровые модели строятся на 80% быстрее, а выпуск документации ускорился примерно вдвое. При этом к текстовой части документации, по словам компании, практически нет замечаний.
Самое важное тут то, что это попытка встроить ИИ прямо в реальный инженерный воркфлоу крупной промышленной компании. Похоже, что один из самых сильных и недооцененных сценариев для AI в ближайшие годы – не чат-боты, а вот такие узкоспециализированные системы, встроенные в конкретные отраслевые процессы.
Следить за другими разработками Норникеля можно в тг-канале @nornickel_official
Компания разработала систему, которая помогает проектировать объекты от фундамента до кровли и автоматически готовит инженерную документацию. По сути, это мультиагентная ИИ-система для промышленного проектирования, обученная на внутренней базе знаний компании, ГОСТах и СНиПах.
Агенты проводят расчеты, собирают цифровую модель здания, формируют спецификации и проверяют все на соответствие корпоративным стандартам и требованиям законодательства. Финальное решение все равно остается за инженером, но основной объем рутины с человека снимается, и это существенно бустит процесс.
А именно: задания на проектирование создаются на 83% быстрее, цифровые модели строятся на 80% быстрее, а выпуск документации ускорился примерно вдвое. При этом к текстовой части документации, по словам компании, практически нет замечаний.
Самое важное тут то, что это попытка встроить ИИ прямо в реальный инженерный воркфлоу крупной промышленной компании. Похоже, что один из самых сильных и недооцененных сценариев для AI в ближайшие годы – не чат-боты, а вот такие узкоспециализированные системы, встроенные в конкретные отраслевые процессы.
Следить за другими разработками Норникеля можно в тг-канале @nornickel_official
🔥140🗿54😁30❤16👍11🤔4👌4🤯3☃2
У Sony Xperia произошла максимально нелепая демонстрация новой ИИ-фичи
Они прорекламировали ИИ-ассистента внутри камеры последнего смартфона линейки. Написали, что агент «подбирает выразительные варианты с настройками цвета, экспозиции и объектива для создания захватывающих дух фотографий».
Первые три картинки выше – это примеры, которые они выбрали для демонстрации функции.
Куда смотрели дизайнеры, не очень понятно, но, как вы понимаете, реакция общественности не заставила себя ждать. Мемы в комменты Sony посыпались градом⬆️
Видимо кому-то из руководства ну очень хотелось «добавить эйай»
Они прорекламировали ИИ-ассистента внутри камеры последнего смартфона линейки. Написали, что агент «подбирает выразительные варианты с настройками цвета, экспозиции и объектива для создания захватывающих дух фотографий».
Первые три картинки выше – это примеры, которые они выбрали для демонстрации функции.
Куда смотрели дизайнеры, не очень понятно, но, как вы понимаете, реакция общественности не заставила себя ждать. Мемы в комменты Sony посыпались градом
Видимо кому-то из руководства ну очень хотелось «добавить эйай»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁341❤19👍8 8🔥5🤯3 1
This media is not supported in your browser
VIEW IN TELEGRAM
FigureAI запустили 10-часовой эксперимент, в котором робот соревновался с человеком в сортировке посылок
Да, 10 часов сортировки пакетиков. Человек имеет право на перекуры по законодательству, робот работает непрерывно (и автономно!).
Трансляция шла вот здесь, и на Polymarker даже принимали ставки на победителя.
Многие, кстати, ставили на робота. Несмотря на то, что для гуманоида это все еще очень сложная задача (требуется быстрая реакция, мелкая моторика, какой-никакой ризонинг и тд), и человек бесспорно быстрее, расчет был на то, что человек устанет и замедлится, а робот – нет.
Так и произошло, но в итоге человек все-таки победил с небольшим отрывом. Парень отсортировал за 10 часов 12924 пакета, а робот – 12732. Их средняя скорость отличалась всего на 0.04 секунды.
Создатель Figure написал, дословно: «Это последний раз, когда человек победил».
Кстати, по окончании 10 часов работы человек открыл пиво, а робот продолжил сортировать посылки как ни в чем не бывало. Выводы делайте сами🤷♂️
Да, 10 часов сортировки пакетиков. Человек имеет право на перекуры по законодательству, робот работает непрерывно (и автономно!).
Трансляция шла вот здесь, и на Polymarker даже принимали ставки на победителя.
Многие, кстати, ставили на робота. Несмотря на то, что для гуманоида это все еще очень сложная задача (требуется быстрая реакция, мелкая моторика, какой-никакой ризонинг и тд), и человек бесспорно быстрее, расчет был на то, что человек устанет и замедлится, а робот – нет.
Так и произошло, но в итоге человек все-таки победил с небольшим отрывом. Парень отсортировал за 10 часов 12924 пакета, а робот – 12732. Их средняя скорость отличалась всего на 0.04 секунды.
Создатель Figure написал, дословно: «Это последний раз, когда человек победил».
Кстати, по окончании 10 часов работы человек открыл пиво, а робот продолжил сортировать посылки как ни в чем не бывало. Выводы делайте сами
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥234😁189🤯58❤16🔥13👍5🗿3
CEO YCombinator Гэрри Тэн опенсорснул собственный модуль памяти для агентов
github.com/garrytan/gbrain
Гэрри пишет, что это продакшен-мозг, на котором работают его личные агенты OpenClaw и Hermes. Ну а на практике это что-то вроде живой базы знаний, которая сама себя обогащает.
Если обычные агенты не помнят контекст между сессиями или записывают что-то в MEMORY.md очень примитивным способом, то здесь предлагается многоуровневая архитектура построения глубокой памяти. Кратко:
– Вся база состоит из markdown файлов. Каждый человек, компания, концепция, встреча – это отдельный файл. Каждый файл – это саммари, которое перезаписывается при поступлении новых данных, и хронологический журнал упоминаний.
– По этой базе работает гибридный поиск. Когда агент что-то ищет, работают одновременно: векторный поиск, поиск по ключевым словам и поиск на графе.
– Граф связей, по которому осуществляется графовый поиск, тоже формируется автоматически и при этом даже без вызова LLM (с помощью регулярок и прописанных правил). То есть система сама себе рисует сеть: кто где работает, кто был на какой стрече, кто во что инвестирует и тд.
Обновляется все это с помощью одного файла RESOLVER.md, в котором прописаны 29 специальных скиллов. Например, meeting-ingestion: транскрипты митингов перерабатываются в режиме сна, чтобы обогощать файлы участников.
Конечно, пользоваться прямо всей этой махиной необязательно. Базовую версию можно поставить себе за 30 минут и использовать как MCP. Лицензия MIT.
github.com/garrytan/gbrain
Гэрри пишет, что это продакшен-мозг, на котором работают его личные агенты OpenClaw и Hermes. Ну а на практике это что-то вроде живой базы знаний, которая сама себя обогащает.
Если обычные агенты не помнят контекст между сессиями или записывают что-то в MEMORY.md очень примитивным способом, то здесь предлагается многоуровневая архитектура построения глубокой памяти. Кратко:
– Вся база состоит из markdown файлов. Каждый человек, компания, концепция, встреча – это отдельный файл. Каждый файл – это саммари, которое перезаписывается при поступлении новых данных, и хронологический журнал упоминаний.
– По этой базе работает гибридный поиск. Когда агент что-то ищет, работают одновременно: векторный поиск, поиск по ключевым словам и поиск на графе.
– Граф связей, по которому осуществляется графовый поиск, тоже формируется автоматически и при этом даже без вызова LLM (с помощью регулярок и прописанных правил). То есть система сама себе рисует сеть: кто где работает, кто был на какой стрече, кто во что инвестирует и тд.
Обновляется все это с помощью одного файла RESOLVER.md, в котором прописаны 29 специальных скиллов. Например, meeting-ingestion: транскрипты митингов перерабатываются в режиме сна, чтобы обогощать файлы участников.
Конечно, пользоваться прямо всей этой махиной необязательно. Базовую версию можно поставить себе за 30 минут и использовать как MCP. Лицензия MIT.
❤110👍35😁15🗿11🔥6🫡3👨💻1
1.3 миллиона долларов в месяц
Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.
Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.
Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.
Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.
Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.
Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.
Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.
Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.
Люди в шоке от наших расходов на AI. Но никто не видит главного: одна из причин, почему меня так вдохновляет работа над OpenClaw – мы пытаемся ответить на вопрос: как будет выглядеть разработка софта в будущем, если стоимость токенов перестанет иметь значение?
❤151😁47🤯25👍22🔥19 15🗿4❤🔥2🐳2🫡2
xAI просила сотрудников продать личные налоговые декларации как обучающие данные для Grok
За каждую декларацию обещали 420 долларов. Это было всего пару месяцев назад, как раз в сезон подачи налогов в США перед дедлайном 15 апреля.
Но самое смешное – даже не сама попытка компании достать данные таким способом. Самое смешное – что сотрудникам по сей день так и не заплатили и платить, кажется, не собираются.
www.bloomberg.com/news/articles/2026-05-18/musk-s-xai-promised-staff-420-for-their-tax-returns-hasn-t-paid
За каждую декларацию обещали 420 долларов. Это было всего пару месяцев назад, как раз в сезон подачи налогов в США перед дедлайном 15 апреля.
Но самое смешное – даже не сама попытка компании достать данные таким способом. Самое смешное – что сотрудникам по сей день так и не заплатили и платить, кажется, не собираются.
www.bloomberg.com/news/articles/2026-05-18/musk-s-xai-promised-staff-420-for-their-tax-returns-hasn-t-paid
😁189🔥11🤨10❤6👍3 3🤔1🤯1🆒1
Строительство ЦОДов должно занимать не 2 года, а 9 месяцев
Только так можно обеспечить конкурентоспособность технологий. С таким заявлением на конференции “ЦИПР-2026” выступил вице-президент и технический директор Т-Банка Олег Щербаков. Он отметил, что технологии сейчас развиваются гораздо быстрее, чем инфраструктура, если не сокращать эту дельту, то к окончанию строительства инфраструктура уже устареет.
Чтобы ускорить строительство нужна прозрачная и понятная регулируемая цепочка, зеленый коридор для строительства, как, например, в Китае. Т-Банк, планирует построить ЦОДы за полтора года. 80% мощностей новых объектов, которые введут в 2027 году, уйдут под данные и инференс — самые растущие нагрузки.
Только так можно обеспечить конкурентоспособность технологий. С таким заявлением на конференции “ЦИПР-2026” выступил вице-президент и технический директор Т-Банка Олег Щербаков. Он отметил, что технологии сейчас развиваются гораздо быстрее, чем инфраструктура, если не сокращать эту дельту, то к окончанию строительства инфраструктура уже устареет.
Чтобы ускорить строительство нужна прозрачная и понятная регулируемая цепочка, зеленый коридор для строительства, как, например, в Китае. Т-Банк, планирует построить ЦОДы за полтора года. 80% мощностей новых объектов, которые введут в 2027 году, уйдут под данные и инференс — самые растущие нагрузки.
❤147🔥65😁60🗿16👍7 4🤔2👌1