Data Secrets

Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей…

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Goodfire показали, как геометрически выглядит математика внутри LLM

Недавно у них вышло очень занятное исследование, в котором они ввели термин neural geometry и доказали, что нейросети "думают" сложными геометрическими структурами. Мы делали разбор этой статьи вот тут: t.iss.one/data_secrets/9194.

Если кратко, суть в том, что внутреннее пространство моделей организовано в виде многомерных форм, поверхностей и траекторий. Эти многообразия вполне интерпретируемы. Например, дни недели лежат как бы на круге, в циклической структуре.

Сегодня лаба выпустила продолжение исследования: они разобрали, как модель "представляет" числа и совершает над ними операции.

Можно было бы ожидать, что в геометрии модели числа будут лежать на абстрактной числовой прямой или будут закодированы двоично, НО НЕТ: каждое число – это окружности. Каждая окружность соответствует числу по модулю некоторого основания, то есть остатку от деления. Например, число 17 было бы представлено как 1 на окружности по модулю 2, как 2 на окружности по модулю 5 и как 7 на окружности по модулю 10.

И это не что иное, как разложение Фурье! Кто бы мог подумать, что оно обнаружится внутри трансформера.

А когда модели нужно что-то посчитать, активируется целый геометрический калькулятор. Например, нужно сложить два числа. Для этого, на самом деле, решается сразу несколько параллельных задач на разных окружностях. Возмем 6 + 8. Модель отдельно считает: (6 mod 2) + (8 mod 2) = 0, (6 mod 5) + (8 mod 5) = 4, (6 mod 10) + (8 mod 10) = 4, и так далее. Все эти результаты вместе декодируются в число 14.

Это напоминает китайскую теорему об остатках. Древнейший математический трюк, который оказался встроен в нейросети совершенно автономно. Кстати, точно так же модели вычисляют разницу в датах, годах и днях недели.

Красивое 😍

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤯191🔥70❤51👍14👌6🗿32

21.5K views16:14

Data Secrets

Microsoft сделали экзамен по вайбкодингу

Они запустили на GitHub сертификацию Agentic AI Developer (GH-600). Это буквально тест на то, насколько вы хороший оркестратор для агентов.

learn.microsoft.com/en-us/credentials/certifications/agentic-ai-developer/

По этой ссылке можно посмотреть, что будет в «билетах» (наверху скрин с общими положениями, а вот тут есть полноценный стади гайд). Есть также список материалов, которые они рекомендуют для подготовки + можно пройти мини-пробник в песочнице.

Сдать экзамен стоит 165$, в итоге вы получите полноценное подтверждение компетенции вайбкодера 👩‍🍳

Please open Telegram to view this post

VIEW IN TELEGRAM

😁189👍46❤25🔥3🍓3🦄22🤨1

25.2K views07:14

Data Secrets

«Норникель» заявил о создании первой в России ИИ-системы для проектирования промышленных зданий

Компания разработала систему, которая помогает проектировать объекты от фундамента до кровли и автоматически готовит инженерную документацию. По сути, это мультиагентная ИИ-система для промышленного проектирования, обученная на внутренней базе знаний компании, ГОСТах и СНиПах.

Агенты проводят расчеты, собирают цифровую модель здания, формируют спецификации и проверяют все на соответствие корпоративным стандартам и требованиям законодательства. Финальное решение все равно остается за инженером, но основной объем рутины с человека снимается, и это существенно бустит процесс.

А именно: задания на проектирование создаются на 83% быстрее, цифровые модели строятся на 80% быстрее, а выпуск документации ускорился примерно вдвое. При этом к текстовой части документации, по словам компании, практически нет замечаний.

Самое важное тут то, что это попытка встроить ИИ прямо в реальный инженерный воркфлоу крупной промышленной компании. Похоже, что один из самых сильных и недооцененных сценариев для AI в ближайшие годы – не чат-боты, а вот такие узкоспециализированные системы, встроенные в конкретные отраслевые процессы.

Следить за другими разработками Норникеля можно в тг-канале @nornickel_official

🔥140🗿54😁30❤16👍11🤔4👌4🤯3☃2

22.3K views08:02

Data Secrets

У Sony Xperia произошла максимально нелепая демонстрация новой ИИ-фичи

Они прорекламировали ИИ-ассистента внутри камеры последнего смартфона линейки. Написали, что агент «подбирает выразительные варианты с настройками цвета, экспозиции и объектива для создания захватывающих дух фотографий».

Первые три картинки выше – это примеры, которые они выбрали для демонстрации функции.

Куда смотрели дизайнеры, не очень понятно, но, как вы понимаете, реакция общественности не заставила себя ждать. Мемы в комменты Sony посыпались градом ⬆️

Видимо кому-то из руководства ну очень хотелось «добавить эйай»

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁341❤19👍88🔥5🤯31

24.6K views10:21

Data Secrets

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

FigureAI запустили 10-часовой эксперимент, в котором робот соревновался с человеком в сортировке посылок

Да, 10 часов сортировки пакетиков. Человек имеет право на перекуры по законодательству, робот работает непрерывно (и автономно!).

Трансляция шла вот здесь, и на Polymarker даже принимали ставки на победителя.

Многие, кстати, ставили на робота. Несмотря на то, что для гуманоида это все еще очень сложная задача (требуется быстрая реакция, мелкая моторика, какой-никакой ризонинг и тд), и человек бесспорно быстрее, расчет был на то, что человек устанет и замедлится, а робот – нет.

Так и произошло, но в итоге человек все-таки победил с небольшим отрывом. Парень отсортировал за 10 часов 12924 пакета, а робот – 12732. Их средняя скорость отличалась всего на 0.04 секунды.

Создатель Figure написал, дословно: «Это последний раз, когда человек победил».

Кстати, по окончании 10 часов работы человек открыл пиво, а робот продолжил сортировать посылки как ни в чем не бывало. Выводы делайте сами 🤷‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥234😁189🤯58❤16🔥13👍5🗿3

25K viewsedited 05:28

Data Secrets

POV: ты пытался объяснить Claude Code, что надо сделать

2😁575👍57❤33🔥4💯3🤝3🤯2

25.6K views08:56

Data Secrets

CEO YCombinator Гэрри Тэн опенсорснул собственный модуль памяти для агентов

github.com/garrytan/gbrain

Гэрри пишет, что это продакшен-мозг, на котором работают его личные агенты OpenClaw и Hermes. Ну а на практике это что-то вроде живой базы знаний, которая сама себя обогащает.

Если обычные агенты не помнят контекст между сессиями или записывают что-то в MEMORY.md очень примитивным способом, то здесь предлагается многоуровневая архитектура построения глубокой памяти. Кратко:

– Вся база состоит из markdown файлов. Каждый человек, компания, концепция, встреча – это отдельный файл. Каждый файл – это саммари, которое перезаписывается при поступлении новых данных, и хронологический журнал упоминаний.

– По этой базе работает гибридный поиск. Когда агент что-то ищет, работают одновременно: векторный поиск, поиск по ключевым словам и поиск на графе.

– Граф связей, по которому осуществляется графовый поиск, тоже формируется автоматически и при этом даже без вызова LLM (с помощью регулярок и прописанных правил). То есть система сама себе рисует сеть: кто где работает, кто был на какой стрече, кто во что инвестирует и тд.

Обновляется все это с помощью одного файла RESOLVER.md, в котором прописаны 29 специальных скиллов. Например, meeting-ingestion: транскрипты митингов перерабатываются в режиме сна, чтобы обогощать файлы участников.

Конечно, пользоваться прямо всей этой махиной необязательно. Базовую версию можно поставить себе за 30 минут и использовать как MCP. Лицензия MIT.

❤110👍35😁15🗿11🔥6🫡3👨‍💻1

21.7K views10:53

Data Secrets

1.3 миллиона долларов в месяц

Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.

Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.

Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.

Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.

Люди в шоке от наших расходов на AI. Но никто не видит главного: одна из причин, почему меня так вдохновляет работа над OpenClaw – мы пытаемся ответить на вопрос: как будет выглядеть разработка софта в будущем, если стоимость токенов перестанет иметь значение?

❤151😁47🤯25👍22🔥1915🗿4❤‍🔥2🐳2🫡2

21.9K views12:31

Data Secrets

xAI просила сотрудников продать личные налоговые декларации как обучающие данные для Grok

За каждую декларацию обещали 420 долларов. Это было всего пару месяцев назад, как раз в сезон подачи налогов в США перед дедлайном 15 апреля.

Но самое смешное – даже не сама попытка компании достать данные таким способом. Самое смешное – что сотрудникам по сей день так и не заплатили и платить, кажется, не собираются.

www.bloomberg.com/news/articles/2026-05-18/musk-s-xai-promised-staff-420-for-their-tax-returns-hasn-t-paid

😁189🔥11🤨10❤6👍33🤔1🤯1🆒1

20.7K viewsedited 16:14

Data Secrets

Строительство ЦОДов должно занимать не 2 года, а 9 месяцев

Только так можно обеспечить конкурентоспособность технологий. С таким заявлением на конференции “ЦИПР-2026” выступил вице-президент и технический директор Т-Банка Олег Щербаков. Он отметил, что технологии сейчас развиваются гораздо быстрее, чем инфраструктура, если не сокращать эту дельту, то к окончанию строительства инфраструктура уже устареет.

Чтобы ускорить строительство нужна прозрачная и понятная регулируемая цепочка, зеленый коридор для строительства, как, например, в Китае. Т-Банк, планирует построить ЦОДы за полтора года. 80% мощностей новых объектов, которые введут в 2027 году, уйдут под данные и инференс — самые растущие нагрузки.

❤147🔥65😁60🗿16👍74🤔2👌1

20.8K views17:28

About

Blog

Apps

Platform