Купил себе новую игрушку — очки Meta & Ray Ban. Теперь могу фотографировать глазами. Из интересного, они выводят звук куда-то над ухом и это неплохо работает. Внутри есть Meta AI, пытаюсь попросить его позвонить ChatGPT, но пока не выходит. Приходится тыкать руками.
🔥6❤2👀1
Я и сам своего рода ученый.
Наш доклад одобрили на SIGGRAPH 2025. Будем рассказывать про диффузионную модель для анимирования персонажей, которая может работать в реальном времени в игровом движке.
Хотя я и написал всю ML-часть, в Ванкувер не поеду — сказывается увлекательная иммиграционная политика США, от которой у меня уже седые волосы лезут.
Основной вклад скорее инженерный, а не научный, поэтому пока не знаю, будем ли пытаться высосать из пальца пэйпер или ограничимся слайдами.
Наш доклад одобрили на SIGGRAPH 2025. Будем рассказывать про диффузионную модель для анимирования персонажей, которая может работать в реальном времени в игровом движке.
Хотя я и написал всю ML-часть, в Ванкувер не поеду — сказывается увлекательная иммиграционная политика США, от которой у меня уже седые волосы лезут.
Основной вклад скорее инженерный, а не научный, поэтому пока не знаю, будем ли пытаться высосать из пальца пэйпер или ограничимся слайдами.
🔥12❤1
Forwarded from НЕ МОРГЕНШТЕРН
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤣7❤1
Наткнулся на офис Blizzard.
Катался с дочкой на велосипеде по городу. В какой-то момент решил съехать с привычного маршрута и увидел офис близов.
Это интересное чувство: в детстве проводишь годы в Варкрафте, а потом оказывается, что их головная компания находится в 15 минутах езды на велосипеде от дома.
Было воскресенье, поэтому контора была закрыта. Но вообще было бы интересно найти контакты внутри и сходить на экскурсию.
Катался с дочкой на велосипеде по городу. В какой-то момент решил съехать с привычного маршрута и увидел офис близов.
Это интересное чувство: в детстве проводишь годы в Варкрафте, а потом оказывается, что их головная компания находится в 15 минутах езды на велосипеде от дома.
Было воскресенье, поэтому контора была закрыта. Но вообще было бы интересно найти контакты внутри и сходить на экскурсию.
🔥17❤4😱1😍1
Интересное видео про диффузионные модели, где автор излагает материал через динамику Ланжевена и score matching.
https://youtu.be/Fk2I6pa6UeA
https://youtu.be/Fk2I6pa6UeA
YouTube
More Than Image Generators: A Science of Problem-Solving using Probability | Diffusion Models
This is my entry to #SoME4, 3Blue1Brown's Summer of Math Exposition Competition!
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
1🔥1
На неделе ко мне в гости приезжал одноклассник. Он занимается физикой в университете на восточном побережье. Мы ели, гуляли, катались на велосипедах, но главное — обсуждали физику и математику.
Давно я не испытывал этого студенческого чувства, когда можно вместе стоять у доски и решать задачи. Когда не стыдно тупить. Когда решаешь не потому, что надо, а потому что хочется и интересно.
На картинке — одна из задачек. Так сказать, делюсь вайбом. Может захотите обсудить ее с товарищем на досуге.
Давно я не испытывал этого студенческого чувства, когда можно вместе стоять у доски и решать задачи. Когда не стыдно тупить. Когда решаешь не потому, что надо, а потому что хочется и интересно.
На картинке — одна из задачек. Так сказать, делюсь вайбом. Может захотите обсудить ее с товарищем на досуге.
1❤9👍1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Genie 3 — SOTA World Model от Google
World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.
Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.
Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.
А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.
Блогпост
@ai_newz
World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.
Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.
Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.
А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.
Блогпост
@ai_newz
1🔥5❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла GPT-5
Я врубил ее в Cursor и попросил написать рендеринг скелетной анимации с помощью ascii символов. Справилась с первой попытки в продакшен репозитории. Разработчики больше не нужны, расходимся.
Самое забавное, что вчера я выторговал себе х1.5 повышение к зп. Либо счастливчик и успел запрыгнуть в последний вагон, либо первый в очереди на сокращение — можно делать ставки.
Я врубил ее в Cursor и попросил написать рендеринг скелетной анимации с помощью ascii символов. Справилась с первой попытки в продакшен репозитории. Разработчики больше не нужны, расходимся.
Самое забавное, что вчера я выторговал себе х1.5 повышение к зп. Либо счастливчик и успел запрыгнуть в последний вагон, либо первый в очереди на сокращение — можно делать ставки.
2😁13👍3
SIGGRAPH
Вчера на крупнейшей конференции по компьютерной графике на аудиторию 2000 человек, на сцене рядом с ребятами из таких компаний как Nvidia и Roblox, была презентация наших наработок из uthana.com.
Мужики показали:
- Real-time диффузию в Unreal Engine 5 и браузере с поддержкой 100+ стилей
- Text-to-motion — генерацию анимаций по тексту
- Motion Stitching (in-betweening) — склейки анимаций с помощью ttm-модели
- Auto-Rigging и Retargeting — перенос анимаций между персонажами
Хотя и не доехал до конфы, потому что она проходила не в США, а в Канаде, я первый автор в тех. репорте и приложил руку ко всем вышеперечисленным фичам.
Вчера на крупнейшей конференции по компьютерной графике на аудиторию 2000 человек, на сцене рядом с ребятами из таких компаний как Nvidia и Roblox, была презентация наших наработок из uthana.com.
Мужики показали:
- Real-time диффузию в Unreal Engine 5 и браузере с поддержкой 100+ стилей
- Text-to-motion — генерацию анимаций по тексту
- Motion Stitching (in-betweening) — склейки анимаций с помощью ttm-модели
- Auto-Rigging и Retargeting — перенос анимаций между персонажами
Хотя и не доехал до конфы, потому что она проходила не в США, а в Канаде, я первый автор в тех. репорте и приложил руку ко всем вышеперечисленным фичам.
YouTube
SIGGRAPH 2025 Real-Time Live!
Experience the connectivity and accessibility of real-time applications across industries in this spectacular live showcase.
#SIGGRAPH2025
#SIGGRAPH2025
🔥21❤9