Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire
Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей организовано не хаотично, а в виде многомерных форм, поверхностей и траекторий. Часто эти многообразия вполне интерпретируемы.
Выглядит это примерно как на первом видео. Авторы назвали явление neural geometry. Причем наблюдается оно не только в LLM, но и в vision моделях, и даже в хайповых world models.
Отличный пример – дни недели. Внутри модели они лежат не по прямой, а по круговой траектории. То есть Monday → Tuesday → Wednesday → … → Sunday образуют циклическую структуру в пространстве активаций.
На практике это значит, что если пытаться линейно перейти от понедельника к пятнице, промежуточные состояния будут бессмысленны, а вот если двигаться, глубо говоря, по окружности – с изменением угла, а не линейным смешиванием координат, – то по пути попадутся вторник, среда и четверг (второе видео).
Подобным геометрическим образом на многообразиях определенных форм лежат время, числа, цвета, биологическая таксономия и куча всего другого.
Авторы настаивают, что исследования neural geometry – это новый фронтир в интерпретации нейросетей, и именно геометрия может стать ключом от черного ящика.
www.goodfire.ai/research/the-world-inside-neural-networks#
Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей организовано не хаотично, а в виде многомерных форм, поверхностей и траекторий. Часто эти многообразия вполне интерпретируемы.
Выглядит это примерно как на первом видео. Авторы назвали явление neural geometry. Причем наблюдается оно не только в LLM, но и в vision моделях, и даже в хайповых world models.
Отличный пример – дни недели. Внутри модели они лежат не по прямой, а по круговой траектории. То есть Monday → Tuesday → Wednesday → … → Sunday образуют циклическую структуру в пространстве активаций.
На практике это значит, что если пытаться линейно перейти от понедельника к пятнице, промежуточные состояния будут бессмысленны, а вот если двигаться, глубо говоря, по окружности – с изменением угла, а не линейным смешиванием координат, – то по пути попадутся вторник, среда и четверг (второе видео).
Подобным геометрическим образом на многообразиях определенных форм лежат время, числа, цвета, биологическая таксономия и куча всего другого.
Авторы настаивают, что исследования neural geometry – это новый фронтир в интерпретации нейросетей, и именно геометрия может стать ключом от черного ящика.
www.goodfire.ai/research/the-world-inside-neural-networks#
🤩151❤82🔥43👍20🤔11😁7🤯3 2
Media is too big
VIEW IN TELEGRAM
Thinking Machines предложили новый тип моделей, которые могут работать в потоке
Они назвали это interaction models. Идея в том, что такая модель изначально обучается для живого взаимодействия с человеком, в отличие от линейных интерфейсов в формате «пользователь написал -> модель ответила», к которым мы привыкли.
Например, она не ждет конца фразы, чтобы начать генерировать ответ; может перебить, если видит ошибку; способна говорить одновременно с пользователем (незаменимо для live-перевода).
Технически, что самое интересное, это делается не через какие-то внешние адаптеры, а вшивается прямо в процесс трейна.
Сама живость диалога достигается за счет разделения входного потока на маленькие чанки примерно по 200 мс, которые поступают в модель в формате стриминга. То есть пока пользователь еще говорит, модель уже видит новые токены и может начать что-то генерировать. За счет этого и становится возможным перебивание, живой перевод и прочее.
Звучит прямо интересно, с такой моделью хотелось бы поболтать. Но с инженерной точки зрения есть проблемы.
Например, большую модель в такой процесс встроить почти невозможно, будет слишком медленно. Так что авторы предлагают делить систему на две части: быструю interaction model, которая поддерживает живой диалог, и background model, которая берет на себя ризонинг, поиск, инструменты и тд. Когда фоновой модели есть что вернуть, interaction model встраивает это в разговор. Идея логичная, но с большими сложностями в реализации и масштабировании.
Плюс, контекст. Для системы в текущем виде длинные сессии вообще неподъемны, авторы это признают. В общем, замысел крайне занятный, но пока что – с большими дырами.
thinkingmachines.ai/blog/interaction-models/
Они назвали это interaction models. Идея в том, что такая модель изначально обучается для живого взаимодействия с человеком, в отличие от линейных интерфейсов в формате «пользователь написал -> модель ответила», к которым мы привыкли.
Например, она не ждет конца фразы, чтобы начать генерировать ответ; может перебить, если видит ошибку; способна говорить одновременно с пользователем (незаменимо для live-перевода).
Технически, что самое интересное, это делается не через какие-то внешние адаптеры, а вшивается прямо в процесс трейна.
Сама живость диалога достигается за счет разделения входного потока на маленькие чанки примерно по 200 мс, которые поступают в модель в формате стриминга. То есть пока пользователь еще говорит, модель уже видит новые токены и может начать что-то генерировать. За счет этого и становится возможным перебивание, живой перевод и прочее.
Звучит прямо интересно, с такой моделью хотелось бы поболтать. Но с инженерной точки зрения есть проблемы.
Например, большую модель в такой процесс встроить почти невозможно, будет слишком медленно. Так что авторы предлагают делить систему на две части: быструю interaction model, которая поддерживает живой диалог, и background model, которая берет на себя ризонинг, поиск, инструменты и тд. Когда фоновой модели есть что вернуть, interaction model встраивает это в разговор. Идея логичная, но с большими сложностями в реализации и масштабировании.
Плюс, контекст. Для системы в текущем виде длинные сессии вообще неподъемны, авторы это признают. В общем, замысел крайне занятный, но пока что – с большими дырами.
thinkingmachines.ai/blog/interaction-models/
👍148❤52🔥27😁7🗿4
Кажется, мы постепенно подходим к моменту, когда новые материалы будут создавать не в лаборатории, а сначала в датасете
«Норникель» и Институт Курнакова РАН запускают проект по созданию ИИ-платформы для генерации новых материалов на основе палладия. По сути это попытка собрать один из первых в России полноценных industrial-grade datasets для цифрового материаловедения.
Что особенно интересно: десятки тысяч экспериментальных измерений, накопленных ИОНХ РАН за десятилетия, впервые превращаются в обучающую среду для ИИ. Не статьи. Не abstract’ы. А реальные данные: составы, кристаллические структуры, физико-химические свойства, поведение материалов в разных условиях.
На первом этапе минимум тысяча уникальных составов. Дальше идет генеративное проектирование новых материалов под конкретные задачи промышленности.
И вот здесь начинается самое важное.Сегодня поиск нового материала – это годы экспериментов. ИИ пытается превратить это в задачу предсказания: если изменить структуру, то как изменятся свойства? Если нужен материал под экстремальную температуру, сверхтонкое покрытие или конкретную электропроводность, то можно ли сгенерировать его заранее?
Один из главных кейсов – попытка заменить золото в микроэлектронике. Сейчас индустрия ежегодно использует около 250 тонн золота: контакты, дорожки, покрытия.
Но при миниатюризации электроники старые материалы начинают упираться в физические ограничения. Палладий здесь выглядит почти идеальным кандидатом: дешевле золота, легче и при этом хорошо работает в защитных и контактных покрытиях.
Фактически задача ИИ-платформы звучит так: «сгенерируй материал под конкретный техпроцесс». Например: для серверных ИИ-процессоров, силовой электроники электромобилей, промышленных датчиков, будущих сверхтонких покрытий.
И это похоже не просто на «AI for science», а на переход к модели, где промышленность начинает обучать собственные фундаментальные ИИ на уникальных отраслевых данных.
«Норникель» и Институт Курнакова РАН запускают проект по созданию ИИ-платформы для генерации новых материалов на основе палладия. По сути это попытка собрать один из первых в России полноценных industrial-grade datasets для цифрового материаловедения.
Что особенно интересно: десятки тысяч экспериментальных измерений, накопленных ИОНХ РАН за десятилетия, впервые превращаются в обучающую среду для ИИ. Не статьи. Не abstract’ы. А реальные данные: составы, кристаллические структуры, физико-химические свойства, поведение материалов в разных условиях.
На первом этапе минимум тысяча уникальных составов. Дальше идет генеративное проектирование новых материалов под конкретные задачи промышленности.
И вот здесь начинается самое важное.Сегодня поиск нового материала – это годы экспериментов. ИИ пытается превратить это в задачу предсказания: если изменить структуру, то как изменятся свойства? Если нужен материал под экстремальную температуру, сверхтонкое покрытие или конкретную электропроводность, то можно ли сгенерировать его заранее?
Один из главных кейсов – попытка заменить золото в микроэлектронике. Сейчас индустрия ежегодно использует около 250 тонн золота: контакты, дорожки, покрытия.
Но при миниатюризации электроники старые материалы начинают упираться в физические ограничения. Палладий здесь выглядит почти идеальным кандидатом: дешевле золота, легче и при этом хорошо работает в защитных и контактных покрытиях.
Фактически задача ИИ-платформы звучит так: «сгенерируй материал под конкретный техпроцесс». Например: для серверных ИИ-процессоров, силовой электроники электромобилей, промышленных датчиков, будущих сверхтонких покрытий.
И это похоже не просто на «AI for science», а на переход к модели, где промышленность начинает обучать собственные фундаментальные ИИ на уникальных отраслевых данных.
🔥144❤35👍26😁18🗿8🤯3🤔2🤨2
Data Secrets
Thinking Machines предложили новый тип моделей, которые могут работать в потоке Они назвали это interaction models. Идея в том, что такая модель изначально обучается для живого взаимодействия с человеком, в отличие от линейных интерфейсов в формате «пользователь…
This media is not supported in your browser
VIEW IN TELEGRAM
А давайте оценим тот факт, что в новом релизе стартапа Миры Мурати Thinking Machines голосовую систему демонстрирует тот же сотрудник, что 2 года назад показывал первое демо GPT-4o в OpenAI
Ну давайте, скажите, что это сделано не специально
Ну давайте, скажите, что это сделано не специально
❤88😁78👍13🔥4🕊1
DeepMind сделали указатель мышки с ИИ
Да, ИИ может в перспективе изменить даже такие привычные вещи. Компьютерный курсор как концепция не менялся почти 50 лет, и вот DeepMind предлагают его переосмыслить.
В их механике курсор – это больше не просто курсор, которым мы водим по интерфейсу, а скорее выделитель контекста для встроенного агента.
Например, вы наводите курсор на таблицу и просите «у мышки» сформировать из нее график. Или выделяете название ресторана на картинке, а агент для вас его бронирует.
Тем самым с человека частично снимается даже такая когнитивная нагрузка, как написание промпта. То есть вам не надо объяснять ИИ детали, вы просто тыкаете во что-то и говорите «расскажи про ЭТО», «перемести ЭТО СЮДА», «исправь ЗДЕСЬ».
И, на самом деле, такое совмещение речи с жестами для человека максимально естественно, так что идея прикольная.
deepmind.google/blog/ai-pointer/
Попробовать уже можно в Gemini in Chrome и в Google AI Studio, а еще указатель собираются встроить в новые ноутбуки GoogleBook, спроектированные специально под ИИ-экспириенс.
Да, ИИ может в перспективе изменить даже такие привычные вещи. Компьютерный курсор как концепция не менялся почти 50 лет, и вот DeepMind предлагают его переосмыслить.
В их механике курсор – это больше не просто курсор, которым мы водим по интерфейсу, а скорее выделитель контекста для встроенного агента.
Например, вы наводите курсор на таблицу и просите «у мышки» сформировать из нее график. Или выделяете название ресторана на картинке, а агент для вас его бронирует.
Тем самым с человека частично снимается даже такая когнитивная нагрузка, как написание промпта. То есть вам не надо объяснять ИИ детали, вы просто тыкаете во что-то и говорите «расскажи про ЭТО», «перемести ЭТО СЮДА», «исправь ЗДЕСЬ».
И, на самом деле, такое совмещение речи с жестами для человека максимально естественно, так что идея прикольная.
deepmind.google/blog/ai-pointer/
Попробовать уже можно в Gemini in Chrome и в Google AI Studio, а еще указатель собираются встроить в новые ноутбуки GoogleBook, спроектированные специально под ИИ-экспириенс.
❤121🔥69🗿24😁20👍19 15🤨14😍2🍓2👾1
Data Secrets
Мы?
Шутки про полуоткрытые ноутбуки – уже не шутки
Инженеры везде таскают с собой слегка открытые ноутбуки, чтобы не прерывать работу агентов. Об этом явлении даже написал Business Insider. В репортаже один из разработчиков сказал, что это современный аналог iPad kid для миллениалов😐
Приоткрывать лаптопы настолько стало рутиной, что предприимчивые разработчики уже придумали специальные USB-заглушки.
Они имитируют подключение внешнего монитора, и это позволяет использовать ноут в закрытом состоянии, не переводя в спящий режим.
Современный проблемы требуют современных решений
Инженеры везде таскают с собой слегка открытые ноутбуки, чтобы не прерывать работу агентов. Об этом явлении даже написал Business Insider. В репортаже один из разработчиков сказал, что это современный аналог iPad kid для миллениалов
Приоткрывать лаптопы настолько стало рутиной, что предприимчивые разработчики уже придумали специальные USB-заглушки.
Они имитируют подключение внешнего монитора, и это позволяет использовать ноут в закрытом состоянии, не переводя в спящий режим.
Современный проблемы требуют современных решений
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁295❤39🔥28🗿16👍8🤩4🤝3⚡2 2😎1
Media is too big
VIEW IN TELEGRAM
Unitree выпустили первого пилотируемого изнутри робота
Их новая модель GD01 – это что-то из Аватара: огромный робот с кабиной для человека. Он умеет ходить на двух и четырех ногах, сносит стены и стоит в районе 42 миллионов рублей.
Unitree позиционирует аппарат как гражданский персональный транспорт. Вместе с пилотом система будет весить около 500кг.
Интересно, водительские права на такого будут нужны?
Их новая модель GD01 – это что-то из Аватара: огромный робот с кабиной для человека. Он умеет ходить на двух и четырех ногах, сносит стены и стоит в районе 42 миллионов рублей.
Unitree позиционирует аппарат как гражданский персональный транспорт. Вместе с пилотом система будет весить около 500кг.
Интересно, водительские права на такого будут нужны?
🔥88😁25❤15🤯10👍3⚡1
Около 15 CEO крупных компаний полетели с Трампом в Китай, чтобы обсуждать торговые отношения
Среди них оказались Тим Кук, Илон Маск, Ларри Финк и другие. Дженсена Хуанга тоже позвали (Трамп в своем посте назвал его Великим), но, судя по новостям, он присоединился к экспедиции чуть ли не в последний момент.
Не так давно вся группа приземлилась в Китае. На официальной встрече с Си Цзиньпином они будут обсуждать снижение торговой напряженности и тарифы, которые могли бы сделать отношения более «сбалансированными».
Без Хуанга, конечно, было бы немного нелепо, потому что именно экспортные ограничения на чипы последнее время прилично подпортили отношения стран. Да, ИИ – это уже геополитика.
Интересно, к чему они придут, и получит ли Китай больший доступ к американскому рынку железа. Напоминаем, что сам Хуанг резко против ограничений на ввоз его чипов в Китай.
Среди них оказались Тим Кук, Илон Маск, Ларри Финк и другие. Дженсена Хуанга тоже позвали (Трамп в своем посте назвал его Великим), но, судя по новостям, он присоединился к экспедиции чуть ли не в последний момент.
Не так давно вся группа приземлилась в Китае. На официальной встрече с Си Цзиньпином они будут обсуждать снижение торговой напряженности и тарифы, которые могли бы сделать отношения более «сбалансированными».
Без Хуанга, конечно, было бы немного нелепо, потому что именно экспортные ограничения на чипы последнее время прилично подпортили отношения стран. Да, ИИ – это уже геополитика.
Интересно, к чему они придут, и получит ли Китай больший доступ к американскому рынку железа. Напоминаем, что сам Хуанг резко против ограничений на ввоз его чипов в Китай.
2🔥85 55👍13❤9😁9🍾1
В одной из школ США родители ученика подали на учреждение в суд из-за того, что ИИ-детектор признал его сочинение сгенерированным
Учитель использовала для проверки его эссе детектор от Turnitin, и он определил сочинение как «на 76% сгенерированное ИИ». Дальше педагог разбираться не стала (несмотря на то, что парень предоставил историю правок из Google Docs и свои черновики), просто понизила оценку и влепила в личное дело пометку об академической нечестности.
Мы погуглили: Turnitin утверждают, что их false positive rate составляет менее 1%. НО это только для документов, которые более чем на 20% сгенерированы. На уровне предложений false positive rate крутится в районе 4%. Все равно немного, но сервис сам обращает внимание на то, что их результаты не стоит использовать в качестве последней инстанции.
Короче, 5 мая родители парня подали иск в Северный окружной суд Калифорнии: требуют восстановить оценку, удалить пометки о нарушении из школьного досье и получить компенсацию.
Иронично, что сочинение было по пьесе Артура Миллера «Суровое испытание». Это произведение буквально посвящено тому, как общество разрушает судьбы людей на основе ненадежных свидетельств.
Учитель использовала для проверки его эссе детектор от Turnitin, и он определил сочинение как «на 76% сгенерированное ИИ». Дальше педагог разбираться не стала (несмотря на то, что парень предоставил историю правок из Google Docs и свои черновики), просто понизила оценку и влепила в личное дело пометку об академической нечестности.
Мы погуглили: Turnitin утверждают, что их false positive rate составляет менее 1%. НО это только для документов, которые более чем на 20% сгенерированы. На уровне предложений false positive rate крутится в районе 4%. Все равно немного, но сервис сам обращает внимание на то, что их результаты не стоит использовать в качестве последней инстанции.
Короче, 5 мая родители парня подали иск в Северный окружной суд Калифорнии: требуют восстановить оценку, удалить пометки о нарушении из школьного досье и получить компенсацию.
Иронично, что сочинение было по пьесе Артура Миллера «Суровое испытание». Это произведение буквально посвящено тому, как общество разрушает судьбы людей на основе ненадежных свидетельств.
Если вы думаете, что ИИ уже повсюду, то вот вам график на подумать
Красное – те, кто используют агентов;
Желтое – платят за чат-ботов;
Зеленое – когда-либо пользовались бесплатными тарифами.
Остальное – люди, ни разу не использовавшие ИИ.
Выглядит, как довольно ранняя стадия распространения технологии. И даже сейчас у нас уже не хватает компьюта на инференс.
Красное – те, кто используют агентов;
Желтое – платят за чат-ботов;
Зеленое – когда-либо пользовались бесплатными тарифами.
Остальное – люди, ни разу не использовавшие ИИ.
Выглядит, как довольно ранняя стадия распространения технологии. И даже сейчас у нас уже не хватает компьюта на инференс.
😁282👍73🤯52❤20🔥8💯3🫡3🗿2
США разрешили примерно 10 китайским компаниям закупать H200, но все не так просто
В ходе переговоров в Китае США расщедрились и разрешили нескольким китайским гигантам, в том числе Alibaba, Tencent и ByteDance, закупку H200 у Nvidia.
Теперь каждая из них может купить до 75 000 чипов по правилам лицензирования США.
Но Китай не то чтобы прыгает от радости. Наоборот, они еще в январе ввели ограничения на закупку иностранного железа, и отступать от этого не планируют.
Во-первых, у них только-только начало развиваться собственное производство, и, конечно, власти будут поддерживать в первую очередь его.
Во-вторых, Китай абсолютно точно осознает, что для США это способ оставить главного конкурента на коротком поводке: продавать достаточно, чтобы сохранять влияние и доходы Nvidia, но не настолько много, чтобы полностью отдать технологическое преимущество. Понятно, что Китай не хочет попадаться на крючок и зависеть от американских экспортных правил.
ИИ гонка окончательно перестала быть гонкой моделей, и стала гонкой цепочек поставок
В ходе переговоров в Китае США расщедрились и разрешили нескольким китайским гигантам, в том числе Alibaba, Tencent и ByteDance, закупку H200 у Nvidia.
Теперь каждая из них может купить до 75 000 чипов по правилам лицензирования США.
Но Китай не то чтобы прыгает от радости. Наоборот, они еще в январе ввели ограничения на закупку иностранного железа, и отступать от этого не планируют.
Во-первых, у них только-только начало развиваться собственное производство, и, конечно, власти будут поддерживать в первую очередь его.
Во-вторых, Китай абсолютно точно осознает, что для США это способ оставить главного конкурента на коротком поводке: продавать достаточно, чтобы сохранять влияние и доходы Nvidia, но не настолько много, чтобы полностью отдать технологическое преимущество. Понятно, что Китай не хочет попадаться на крючок и зависеть от американских экспортных правил.
ИИ гонка окончательно перестала быть гонкой моделей, и стала гонкой цепочек поставок
❤137👍54🔥25 22🤯6😁4🤔1
В Твиттере раскритиковали известнейшую картину Клода Моне, потому что поверили, что она сгенерирована
Один гениальный юзер запостил две картины из серии «Кувшинки», заявив, что первую он сгенерировал, а вторая – настоящая. Он попросил других пользователей детально рассказать, чем «фейк» отличается от подлинника.
https://x.com/shl0ms/status/2054280631807316329?s=46&t=pKf_FxsPGBd_YMIWTA8xgg
На самом деле обе картины оказались настоящими творениями Моне, но пользователи буквально заполонили комментарии критикой первого полотна.
Они писали, что «совершенно очевидно», что это генерация, называли «типичные ошибки» в цвете, свете и деталях. Кто-то назвал картину «мазней» и «грязью».
После того как автор объяснил, что обе картины – это настоящий Моне, часть комментариев сразу же оказались удалены🤷♂️
Один гениальный юзер запостил две картины из серии «Кувшинки», заявив, что первую он сгенерировал, а вторая – настоящая. Он попросил других пользователей детально рассказать, чем «фейк» отличается от подлинника.
https://x.com/shl0ms/status/2054280631807316329?s=46&t=pKf_FxsPGBd_YMIWTA8xgg
На самом деле обе картины оказались настоящими творениями Моне, но пользователи буквально заполонили комментарии критикой первого полотна.
Они писали, что «совершенно очевидно», что это генерация, называли «типичные ошибки» в цвете, свете и деталях. Кто-то назвал картину «мазней» и «грязью».
После того как автор объяснил, что обе картины – это настоящий Моне, часть комментариев сразу же оказались удалены
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁483❤32👍13 8🤓7🔥1
Claude помог пользователю восстановить доступ к кошельку с 5 биткоинами, который был недоступен 3 года
Сумма на счете оценивается примерно в 400 тысяч долларов. Когда-то давно владелец потерял к нему доступ из-за ошибки в хранении файла с паролем.
Агент нашел в недрах старого компьютера юзера нужный файл, обнаружил ошибку в btcrecover, исправил ее и расшифровал пароль.
История разлетелась на миллионы просмотров, а парень теперь обещает назвать своих детей в честь Дарио Амодеи
Сумма на счете оценивается примерно в 400 тысяч долларов. Когда-то давно владелец потерял к нему доступ из-за ошибки в хранении файла с паролем.
Агент нашел в недрах старого компьютера юзера нужный файл, обнаружил ошибку в btcrecover, исправил ее и расшифровал пароль.
История разлетелась на миллионы просмотров, а парень теперь обещает назвать своих детей в честь Дарио Амодеи
🔥304😁96👍30❤16⚡1🤓1