Forwarded from НЕ МОРГЕНШТЕРН
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤣7❤1
Наткнулся на офис Blizzard.
Катался с дочкой на велосипеде по городу. В какой-то момент решил съехать с привычного маршрута и увидел офис близов.
Это интересное чувство: в детстве проводишь годы в Варкрафте, а потом оказывается, что их головная компания находится в 15 минутах езды на велосипеде от дома.
Было воскресенье, поэтому контора была закрыта. Но вообще было бы интересно найти контакты внутри и сходить на экскурсию.
Катался с дочкой на велосипеде по городу. В какой-то момент решил съехать с привычного маршрута и увидел офис близов.
Это интересное чувство: в детстве проводишь годы в Варкрафте, а потом оказывается, что их головная компания находится в 15 минутах езды на велосипеде от дома.
Было воскресенье, поэтому контора была закрыта. Но вообще было бы интересно найти контакты внутри и сходить на экскурсию.
🔥17❤4😱1😍1
Интересное видео про диффузионные модели, где автор излагает материал через динамику Ланжевена и score matching.
https://youtu.be/Fk2I6pa6UeA
https://youtu.be/Fk2I6pa6UeA
YouTube
More Than Image Generators: A Science of Problem-Solving using Probability | Diffusion Models
This is my entry to #SoME4, 3Blue1Brown's Summer of Math Exposition Competition!
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
1🔥1
На неделе ко мне в гости приезжал одноклассник. Он занимается физикой в университете на восточном побережье. Мы ели, гуляли, катались на велосипедах, но главное — обсуждали физику и математику.
Давно я не испытывал этого студенческого чувства, когда можно вместе стоять у доски и решать задачи. Когда не стыдно тупить. Когда решаешь не потому, что надо, а потому что хочется и интересно.
На картинке — одна из задачек. Так сказать, делюсь вайбом. Может захотите обсудить ее с товарищем на досуге.
Давно я не испытывал этого студенческого чувства, когда можно вместе стоять у доски и решать задачи. Когда не стыдно тупить. Когда решаешь не потому, что надо, а потому что хочется и интересно.
На картинке — одна из задачек. Так сказать, делюсь вайбом. Может захотите обсудить ее с товарищем на досуге.
1❤9👍1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Genie 3 — SOTA World Model от Google
World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.
Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.
Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.
А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.
Блогпост
@ai_newz
World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.
Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.
Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.
А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.
Блогпост
@ai_newz
1🔥5❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла GPT-5
Я врубил ее в Cursor и попросил написать рендеринг скелетной анимации с помощью ascii символов. Справилась с первой попытки в продакшен репозитории. Разработчики больше не нужны, расходимся.
Самое забавное, что вчера я выторговал себе х1.5 повышение к зп. Либо счастливчик и успел запрыгнуть в последний вагон, либо первый в очереди на сокращение — можно делать ставки.
Я врубил ее в Cursor и попросил написать рендеринг скелетной анимации с помощью ascii символов. Справилась с первой попытки в продакшен репозитории. Разработчики больше не нужны, расходимся.
Самое забавное, что вчера я выторговал себе х1.5 повышение к зп. Либо счастливчик и успел запрыгнуть в последний вагон, либо первый в очереди на сокращение — можно делать ставки.
2😁13👍3
SIGGRAPH
Вчера на крупнейшей конференции по компьютерной графике на аудиторию 2000 человек, на сцене рядом с ребятами из таких компаний как Nvidia и Roblox, была презентация наших наработок из uthana.com.
Мужики показали:
- Real-time диффузию в Unreal Engine 5 и браузере с поддержкой 100+ стилей
- Text-to-motion — генерацию анимаций по тексту
- Motion Stitching (in-betweening) — склейки анимаций с помощью ttm-модели
- Auto-Rigging и Retargeting — перенос анимаций между персонажами
Хотя и не доехал до конфы, потому что она проходила не в США, а в Канаде, я первый автор в тех. репорте и приложил руку ко всем вышеперечисленным фичам.
Вчера на крупнейшей конференции по компьютерной графике на аудиторию 2000 человек, на сцене рядом с ребятами из таких компаний как Nvidia и Roblox, была презентация наших наработок из uthana.com.
Мужики показали:
- Real-time диффузию в Unreal Engine 5 и браузере с поддержкой 100+ стилей
- Text-to-motion — генерацию анимаций по тексту
- Motion Stitching (in-betweening) — склейки анимаций с помощью ttm-модели
- Auto-Rigging и Retargeting — перенос анимаций между персонажами
Хотя и не доехал до конфы, потому что она проходила не в США, а в Канаде, я первый автор в тех. репорте и приложил руку ко всем вышеперечисленным фичам.
YouTube
SIGGRAPH 2025 Real-Time Live!
Experience the connectivity and accessibility of real-time applications across industries in this spectacular live showcase.
#SIGGRAPH2025
#SIGGRAPH2025
🔥24❤9
Очень интересно, но слишком сложно. Попросил GPT объяснить.
Авторы впервые систематически находят нестабильные сингулярности для ряда уравнений гидродинамики (CCF-модель, 2D IPM, 2D Буссинеска, связанная с осесимметричным 3D-Эйлером с границей). Они совмещают PINN с высокоточным методом Гаусса–Ньютона и тщательно сконструированными индуктивными байасами, работают в самоподобных координатах, подбирают допустимые масштабирующие коэффициенты λ и достигают точности вплоть до предела двойной точности на GPU. Показана эмпирическая связь между скоростью взрыва (blow-up) и «порядком нестабильности»: меньшие λ соответствуют «более нестабильным и более резким» сингулярностям. Это прокладывает дорогу к компьютерно подкреплённым доказательствам (CAP) для действительно «трудных» случаев Эйлера/Навье–Стокса.
👍2
Forwarded from gonzo-обзоры ML статей
А вот и Навье-Стокс от Дипмайнда подоспел
https://deepmind.google/discover/blog/discovering-new-solutions-to-century-old-problems-in-fluid-dynamics/
https://deepmind.google/discover/blog/discovering-new-solutions-to-century-old-problems-in-fluid-dynamics/
Google DeepMind
Discovering new solutions to century-old problems in fluid dynamics
In a new paper, we introduce an entirely new family of mathematical blow ups to some of the most complex equations that describe fluid motion. Our approach presents a new way in which...
GPT для Dota 2
Смотрел на досуге The International и задавался вопросами:
- Какое аое у сна наги?
- Что меняли сфу в последних 5 патчах?
- Что дает и сколько стоит свифт блинк?
Плюс мне хотелось пощупать GPT 5 через API. В итоге за пару вечеров завайбкодил себе telegram-бота с RAG по доте.
Сначала в качестве источника данных использовал игровые wiki-сайты. Проблема в том, что там часто попадается устаревшая информаци. Поэтому я стал напрямую парсить файлы из игры.
Попробовал retriever на эмбедингах от LlamaIndex. Быстро стало понятно, что не работает, когда в вопросе используются алиасы по типу “сф” вместо Shadow Fiend. Плюс иногда информация про сфа может встретиться рядом с инфой про другого персонажа, например в патчноуте, что тоже приводит к ошибкам.
В итоге сошелся к пайплайну из 3 шагов:
1. Распознование и нормализация сущностей: сф -> Shadow Fiend
2. Добавление информации по персонажу в промпт
3. Генерация финального ответа
Для 1 и 3 пунктов использую gpt-5-mini с reasoning_effort=low. При таких настройках стоимость ответа около $0.005. Локально отрабатывает секунд за 7. В облаке чуть дольше, потому что крутится в контейнере с 1 CPU и 1 GB RAM.
И вроде бы это все, что нужно для счастья. Но я вошел во вкус и стало мало. При такой архитектуре не получается отвечать на вопросы:
- топ-3 самых дорогих по мане ульты
- какие предметы дают лайфстил?
- у каких нейтралов есть стан?
В итоге я решил собрать граф с онтологией игры и дать LLM доступ к интерпретатору, чтобы она могла писать запросы. Получился полноценный дота-агент. Но это уже совсем другая история, которую я расскажу в следующий раз.
Смотрел на досуге The International и задавался вопросами:
- Какое аое у сна наги?
- Что меняли сфу в последних 5 патчах?
- Что дает и сколько стоит свифт блинк?
Плюс мне хотелось пощупать GPT 5 через API. В итоге за пару вечеров завайбкодил себе telegram-бота с RAG по доте.
Сначала в качестве источника данных использовал игровые wiki-сайты. Проблема в том, что там часто попадается устаревшая информаци. Поэтому я стал напрямую парсить файлы из игры.
Попробовал retriever на эмбедингах от LlamaIndex. Быстро стало понятно, что не работает, когда в вопросе используются алиасы по типу “сф” вместо Shadow Fiend. Плюс иногда информация про сфа может встретиться рядом с инфой про другого персонажа, например в патчноуте, что тоже приводит к ошибкам.
В итоге сошелся к пайплайну из 3 шагов:
1. Распознование и нормализация сущностей: сф -> Shadow Fiend
2. Добавление информации по персонажу в промпт
3. Генерация финального ответа
Для 1 и 3 пунктов использую gpt-5-mini с reasoning_effort=low. При таких настройках стоимость ответа около $0.005. Локально отрабатывает секунд за 7. В облаке чуть дольше, потому что крутится в контейнере с 1 CPU и 1 GB RAM.
И вроде бы это все, что нужно для счастья. Но я вошел во вкус и стало мало. При такой архитектуре не получается отвечать на вопросы:
- топ-3 самых дорогих по мане ульты
- какие предметы дают лайфстил?
- у каких нейтралов есть стан?
В итоге я решил собрать граф с онтологией игры и дать LLM доступ к интерпретатору, чтобы она могла писать запросы. Получился полноценный дота-агент. Но это уже совсем другая история, которую я расскажу в следующий раз.
👍9🔥7😁4