Data Secrets
90.2K subscribers
6.94K photos
780 videos
20 files
3.11K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire

Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей организовано не хаотично, а в виде многомерных форм, поверхностей и траекторий. Часто эти многообразия вполне интерпретируемы.

Выглядит это примерно как на первом видео. Авторы назвали явление neural geometry. Причем наблюдается оно не только в LLM, но и в vision моделях, и даже в хайповых world models.

Отличный пример – дни недели. Внутри модели они лежат не по прямой, а по круговой траектории. То есть Monday → Tuesday → Wednesday → … → Sunday образуют циклическую структуру в пространстве активаций.

На практике это значит, что если пытаться линейно перейти от понедельника к пятнице, промежуточные состояния будут бессмысленны, а вот если двигаться, глубо говоря, по окружности – с изменением угла, а не линейным смешиванием координат, – то по пути попадутся вторник, среда и четверг (второе видео).

Подобным геометрическим образом на многообразиях определенных форм лежат время, числа, цвета, биологическая таксономия и куча всего другого.

Авторы настаивают, что исследования neural geometry – это новый фронтир в интерпретации нейросетей, и именно геометрия может стать ключом от черного ящика.

www.goodfire.ai/research/the-world-inside-neural-networks#
🤩15182🔥43👍20🤔11😁7🤯32
Media is too big
VIEW IN TELEGRAM
Thinking Machines предложили новый тип моделей, которые могут работать в потоке

Они назвали это interaction models. Идея в том, что такая модель изначально обучается для живого взаимодействия с человеком, в отличие от линейных интерфейсов в формате «пользователь написал -> модель ответила», к которым мы привыкли.

Например, она не ждет конца фразы, чтобы начать генерировать ответ; может перебить, если видит ошибку; способна говорить одновременно с пользователем (незаменимо для live-перевода).

Технически, что самое интересное, это делается не через какие-то внешние адаптеры, а вшивается прямо в процесс трейна.

Сама живость диалога достигается за счет разделения входного потока на маленькие чанки примерно по 200 мс, которые поступают в модель в формате стриминга. То есть пока пользователь еще говорит, модель уже видит новые токены и может начать что-то генерировать. За счет этого и становится возможным перебивание, живой перевод и прочее.

Звучит прямо интересно, с такой моделью хотелось бы поболтать. Но с инженерной точки зрения есть проблемы.

Например, большую модель в такой процесс встроить почти невозможно, будет слишком медленно. Так что авторы предлагают делить систему на две части: быструю interaction model, которая поддерживает живой диалог, и background model, которая берет на себя ризонинг, поиск, инструменты и тд. Когда фоновой модели есть что вернуть, interaction model встраивает это в разговор. Идея логичная, но с большими сложностями в реализации и масштабировании.

Плюс, контекст. Для системы в текущем виде длинные сессии вообще неподъемны, авторы это признают. В общем, замысел крайне занятный, но пока что – с большими дырами.

thinkingmachines.ai/blog/interaction-models/
👍14852🔥27😁7🗿4
Кажется, мы постепенно подходим к моменту, когда новые материалы будут создавать не в лаборатории, а сначала в датасете

«Норникель» и Институт Курнакова РАН запускают проект по созданию ИИ-платформы для генерации новых материалов на основе палладия. По сути это попытка собрать один из первых в России полноценных industrial-grade datasets для цифрового материаловедения.

Что особенно интересно: десятки тысяч экспериментальных измерений, накопленных ИОНХ РАН за десятилетия, впервые превращаются в обучающую среду для ИИ. Не статьи. Не abstract’ы. А реальные данные: составы, кристаллические структуры, физико-химические свойства, поведение материалов в разных условиях.

На первом этапе минимум тысяча уникальных составов. Дальше идет генеративное проектирование новых материалов под конкретные задачи промышленности.

И вот здесь начинается самое важное.Сегодня поиск нового материала – это годы экспериментов. ИИ пытается превратить это в задачу предсказания: если изменить структуру, то как изменятся свойства? Если нужен материал под экстремальную температуру, сверхтонкое покрытие или конкретную электропроводность, то можно ли сгенерировать его заранее?

Один из главных кейсов – попытка заменить золото в микроэлектронике. Сейчас индустрия ежегодно использует около 250 тонн золота: контакты, дорожки, покрытия.

Но при миниатюризации электроники старые материалы начинают упираться в физические ограничения. Палладий здесь выглядит почти идеальным кандидатом: дешевле золота, легче и при этом хорошо работает в защитных и контактных покрытиях.

Фактически задача ИИ-платформы звучит так: «сгенерируй материал под конкретный техпроцесс». Например: для серверных ИИ-процессоров, силовой электроники электромобилей, промышленных датчиков, будущих сверхтонких покрытий.

И это похоже не просто на «AI for science», а на переход к модели, где промышленность начинает обучать собственные фундаментальные ИИ на уникальных отраслевых данных.
🔥14435👍26😁18🗿8🤯3🤔2🤨2
Data Secrets
Thinking Machines предложили новый тип моделей, которые могут работать в потоке Они назвали это interaction models. Идея в том, что такая модель изначально обучается для живого взаимодействия с человеком, в отличие от линейных интерфейсов в формате «пользователь…
This media is not supported in your browser
VIEW IN TELEGRAM
А давайте оценим тот факт, что в новом релизе стартапа Миры Мурати Thinking Machines голосовую систему демонстрирует тот же сотрудник, что 2 года назад показывал первое демо GPT-4o в OpenAI

Ну давайте, скажите, что это сделано не специально
88😁78👍13🔥4🕊1
DeepMind сделали указатель мышки с ИИ

Да, ИИ может в перспективе изменить даже такие привычные вещи. Компьютерный курсор как концепция не менялся почти 50 лет, и вот DeepMind предлагают его переосмыслить.

В их механике курсор – это больше не просто курсор, которым мы водим по интерфейсу, а скорее выделитель контекста для встроенного агента.

Например, вы наводите курсор на таблицу и просите «у мышки» сформировать из нее график. Или выделяете название ресторана на картинке, а агент для вас его бронирует.

Тем самым с человека частично снимается даже такая когнитивная нагрузка, как написание промпта. То есть вам не надо объяснять ИИ детали, вы просто тыкаете во что-то и говорите «расскажи про ЭТО», «перемести ЭТО СЮДА», «исправь ЗДЕСЬ».

И, на самом деле, такое совмещение речи с жестами для человека максимально естественно, так что идея прикольная.

deepmind.google/blog/ai-pointer/

Попробовать уже можно в Gemini in Chrome и в Google AI Studio, а еще указатель собираются встроить в новые ноутбуки GoogleBook, спроектированные специально под ИИ-экспириенс.
121🔥69🗿24😁20👍1915🤨14😍2🍓2👾1
Data Secrets
Мы?
Шутки про полуоткрытые ноутбуки – уже не шутки

Инженеры везде таскают с собой слегка открытые ноутбуки, чтобы не прерывать работу агентов. Об этом явлении даже написал Business Insider. В репортаже один из разработчиков сказал, что это современный аналог iPad kid для миллениалов 😐

Приоткрывать лаптопы настолько стало рутиной, что предприимчивые разработчики уже придумали специальные USB-заглушки.

Они имитируют подключение внешнего монитора, и это позволяет использовать ноут в закрытом состоянии, не переводя в спящий режим.

Современный проблемы требуют современных решений
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁29539🔥28🗿16👍8🤩4🤝322😎1
Media is too big
VIEW IN TELEGRAM
Unitree выпустили первого пилотируемого изнутри робота

Их новая модель GD01 – это что-то из Аватара: огромный робот с кабиной для человека. Он умеет ходить на двух и четырех ногах, сносит стены и стоит в районе 42 миллионов рублей.

Unitree позиционирует аппарат как гражданский персональный транспорт. Вместе с пилотом система будет весить около 500кг.

Интересно, водительские права на такого будут нужны?
🔥88😁2515🤯10👍31
Около 15 CEO крупных компаний полетели с Трампом в Китай, чтобы обсуждать торговые отношения

Среди них оказались Тим Кук, Илон Маск, Ларри Финк и другие. Дженсена Хуанга тоже позвали (Трамп в своем посте назвал его Великим), но, судя по новостям, он присоединился к экспедиции чуть ли не в последний момент.

Не так давно вся группа приземлилась в Китае. На официальной встрече с Си Цзиньпином они будут обсуждать снижение торговой напряженности и тарифы, которые могли бы сделать отношения более «сбалансированными».

Без Хуанга, конечно, было бы немного нелепо, потому что именно экспортные ограничения на чипы последнее время прилично подпортили отношения стран. Да, ИИ – это уже геополитика.

Интересно, к чему они придут, и получит ли Китай больший доступ к американскому рынку железа. Напоминаем, что сам Хуанг резко против ограничений на ввоз его чипов в Китай.
2🔥8555👍139😁9🍾1
В одной из школ США родители ученика подали на учреждение в суд из-за того, что ИИ-детектор признал его сочинение сгенерированным

Учитель использовала для проверки его эссе детектор от Turnitin, и он определил сочинение как «на 76% сгенерированное ИИ». Дальше педагог разбираться не стала (несмотря на то, что парень предоставил историю правок из Google Docs и свои черновики), просто понизила оценку и влепила в личное дело пометку об академической нечестности.

Мы погуглили: Turnitin утверждают, что их false positive rate составляет менее 1%. НО это только для документов, которые более чем на 20% сгенерированы. На уровне предложений false positive rate крутится в районе 4%. Все равно немного, но сервис сам обращает внимание на то, что их результаты не стоит использовать в качестве последней инстанции.

Короче, 5 мая родители парня подали иск в Северный окружной суд Калифорнии: требуют восстановить оценку, удалить пометки о нарушении из школьного досье и получить компенсацию.

Иронично, что сочинение было по пьесе Артура Миллера «Суровое испытание». Это произведение буквально посвящено тому, как общество разрушает судьбы людей на основе ненадежных свидетельств.
285😁169👍7023🔥1312🤯8❤‍🔥1
Nvidia стала первой в мире компанией, капитализация которой достигла $5,500,000,000,000.00

5.5 триллионов долларов.

Это больше, чем ВВП любой страны мира, кроме США и Китая.
🤯360🔥6426👍10😁9🕊3🏆1
Если вы думаете, что ИИ уже повсюду, то вот вам график на подумать

Красное – те, кто используют агентов;
Желтое – платят за чат-ботов;
Зеленое – когда-либо пользовались бесплатными тарифами.

Остальное – люди, ни разу не использовавшие ИИ.

Выглядит, как довольно ранняя стадия распространения технологии. И даже сейчас у нас уже не хватает компьюта на инференс.
😁282👍73🤯5220🔥8💯3🫡3🗿2
США разрешили примерно 10 китайским компаниям закупать H200, но все не так просто

В ходе переговоров в Китае США расщедрились и разрешили нескольким китайским гигантам, в том числе Alibaba, Tencent и ByteDance, закупку H200 у Nvidia.

Теперь каждая из них может купить до 75 000 чипов по правилам лицензирования США.

Но Китай не то чтобы прыгает от радости. Наоборот, они еще в январе ввели ограничения на закупку иностранного железа, и отступать от этого не планируют.

Во-первых, у них только-только начало развиваться собственное производство, и, конечно, власти будут поддерживать в первую очередь его.

Во-вторых, Китай абсолютно точно осознает, что для США это способ оставить главного конкурента на коротком поводке: продавать достаточно, чтобы сохранять влияние и доходы Nvidia, но не настолько много, чтобы полностью отдать технологическое преимущество. Понятно, что Китай не хочет попадаться на крючок и зависеть от американских экспортных правил.

ИИ гонка окончательно перестала быть гонкой моделей, и стала гонкой цепочек поставок
137👍54🔥2522🤯6😁4🤔1
В Твиттере раскритиковали известнейшую картину Клода Моне, потому что поверили, что она сгенерирована

Один гениальный юзер запостил две картины из серии «Кувшинки», заявив, что первую он сгенерировал, а вторая – настоящая. Он попросил других пользователей детально рассказать, чем «фейк» отличается от подлинника.

https://x.com/shl0ms/status/2054280631807316329?s=46&t=pKf_FxsPGBd_YMIWTA8xgg

На самом деле обе картины оказались настоящими творениями Моне, но пользователи буквально заполонили комментарии критикой первого полотна.

Они писали, что «совершенно очевидно», что это генерация, называли «типичные ошибки» в цвете, свете и деталях. Кто-то назвал картину «мазней» и «грязью».

После того как автор объяснил, что обе картины – это настоящий Моне, часть комментариев сразу же оказались удалены 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁48332👍138🤓7🔥1
Claude помог пользователю восстановить доступ к кошельку с 5 биткоинами, который был недоступен 3 года

Сумма на счете оценивается примерно в 400 тысяч долларов. Когда-то давно владелец потерял к нему доступ из-за ошибки в хранении файла с паролем.

Агент нашел в недрах старого компьютера юзера нужный файл, обнаружил ошибку в btcrecover, исправил ее и расшифровал пароль.

История разлетелась на миллионы просмотров, а парень теперь обещает назвать своих детей в честь Дарио Амодеи
🔥304😁96👍30161🤓1