VAI
2.77K subscribers
441 photos
75 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
В последнее время одним из художников, которым я особенно вдохновляюсь, стал Альберто Мьельго. Крутой мужик! 💪

Моя любовь к его стилю началась с Человека-паука: Через вселенные. Там сошлось всё — и уникальная стилистика, и сильный сюжет. Потом я увидел его работы для Netflix в Любовь, смерть и роботы — Свидетель, Джибаро. Уже тогда я подумал: «О, как-то это похоже на стиль Человека-паука». Но только позже узнал, что это один и тот же автор.

Отдельно стоит отметить Стеклоочиститель — проект, который он сделал с небольшой командой на коленке и за который получил «Оскар».

В игровой индустрии он тоже успел оставить свой след. Трейлер Watch Dogs: Legion я как-то пропустил и посмотрел только недавно, но Marathon я ждал с интересом. И когда увидел трейлер, сразу подумал: «Похоже на Мьельго». И потом узнал, что он также выступил там автором .

Это невероятно круто и по-настоящему свежее визуальное мышление. 🔥🔥🔥

На работе мы собрали подборку интересных стилистик, которые используем как референсы в производстве — и стиль Мьельго среди них.

Решил попробовать перенести его визуальный язык через ИИ. Получилось не всё, с чем я доволен, но, на мой взгляд, похоже.

@VAI_ART
#VAI_Gallery
8👍3
Forwarded from Data Secrets
О, на всеми любимом YouTube канале 3blue1brown впервые за долгое время вышло новое видео

Тема: диффузионные модели

За 40 минут автор в фирменном мультипликационном стиле буквально раскладывает по полочкам, как работают современные генераторы картинок и видео.

Сначала – основы. CLIP, эмбеддинги, скрытые пространства, архитектура ванильных диффузионных моделей. А потом уже рассказывается и про DDIM, и про устройство Dall E 2, и про conditioning, и про многое другое.

В общем получился довольно подробный ролик. Тем, кто в генерации новичок, посмотреть точно стоит. Профессионалам тоже советуем – чисто насладиться эстетикой 😍

youtu.be/iv-5mZ_9CPY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
На этой неделе ничего очень значительного не произошло, но вышли улучшенные версии уже существующих инструментов.

🔹 Qwen3 обновился. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
По сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Даже Kimi K2 про который писал недавно обходит, причем достаточно неплохо.

🔹 RunWay. Анонсировал инструмент Aleph, который должен появиться на днях. Aleph - это современная модель контекстного видео, открывающая новые горизонты многозадачной генерации визуальных эффектов, позволяющая выполнять широкий спектр операций редактирования исходного видео, таких как добавление, удаление и преобразование объектов, получение новых ракурсов сцены, изменение стиля и освещения, а также множество других задач. Прикрепил презентацию в комментарии.

🔹 Kling AI. Про который уже писал ранее. Kling AI Elements получил обновление. Позволяет генерировать видео на основе 1–4 изображений, автоматически объединяя их в единую динамическую сцену на основе вашей подсказки. Возможность добавлять, удалять или заменять элементы напрямую в интерактивном редакторе без использования внешних инструментов. Значительно улучшены согласованность сюжета, динамика и качество визуального рендеринга.

🔹 Midjourney. Недавно во всеми любимом генераторе ИИ изображений появилась возможность генерировать видео. Писал про него тут. Видео генератор понемногу развивается и обрастает интересными фишками. На этой неделе сделали возможность добавления последнего кадра. Теперь контролировать видео стало легче.

🔹Magnific AI. Новый тип апскейла – Precision (точность) – предлагает настройки для улучшения качества изображений. Уровень резкости, улучшает края и текстуры, повышая визуальную ясность, но высокие значения могут сделать изображение искусственным. Умные края с низкими значениями (7% - 12%) сохраняют оригинальное зерно, подходящее для фотографий или пленки, а высокие значения добавляют художественный или экспериментальный эффект. Настройка Ультра детализация повышает фокусировку и четкость, но при высоких значениях могут появляться артефакты, такие как гало или сдвиги контрастности, что делает изображение более искусственным. В данный момент апскейл работает в 2X, с возможностью увеличения изображения несколько раз.

🔹 Hedra запустили Live Avatars — это технология, позволяющая анимировать 3D-аватары в реальном времени прямо в браузере без установки. Система синхронизирует мимику и движения головы по видео с камеры, работает быстро и точно, поддерживает реалистичные и стилизованные лица, и легко интегрируется через LiveKit API. Это решение идеально для ассистентов и онлайн-презентаций — при этом стоит всего ~$0.05 за минуту, что делает его в десятки раз дешевле аналогов.

🔹ChatGPT. Новость, скорее всего, не новая, но в GPT при редактировании изображений наконец-то улучшили консистентность. Раньше, если просил добавить усы на фото (как пример), то система помимо усов сильно меняла само лицо. Сейчас работает гораздо лучше и практически не изменяет исходное изображение.

Что у вас? Может что - то пропустил? 🧐

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101
Последнее время зарылся в какие-то эксперименты, которые не получается довести до конца.
И тут либо показывать то, что есть — потому что даже на этом этапе ИИ реально помогают в работе, либо ждать, пока инструменты доведут до рабочего состояния и уже показать в полную силу. 🧐
Я выбрал второй вариант. Там реально неплохие штуки, и хочется показать их во всей красе.

Поэтому пачка постов уезжает на неопределённое время в стол.

Нормально. Едем дальше! 💪

Чтобы немного перебить пустоту, покажу интересный способ, как сделать свой пак стикеров (в данном случае на основе своей фотографии).

Делается быстро и без особых проблем.

В Sora пишу такой промпт:

Серия стикеров в пиксель-арт стиле на основе референса. Туда войдут:
– шлёт поцелуй
– влюблённый
– злой
– задумчивый
– показывает язык
– смеётся
Расположи их в виде чёткой сетки с достаточными отступами по вертикали и горизонтали, чтобы стикеры не были обрезаны. Убедись, что стиль стикеров един для всего сета.
Сделай это всё на одном изображении и на прозрачном фоне.


Этим мне Sora и нравится — можно просто писать как техническое задание, а не извращаться с промтингом.

Дальше прогнал через апскейлер. Мне нравится, как работает небольшая программка Upscayl, которая ставится на комп.
Чтобы вытащить что-то не очень шакальное — быстро, очень помогает.

В итоге получаем любой стикерпак за 10 минут.

Помню, как-то на один из проектов надо было делать стикеры для чата — на пак уходило пару дней. Сейчас, с ручными доработками, можно уложиться в полчаса - час.

Пользуйтесь! 🔥🔥🔥

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍6🔥2👌2
Эксперименты с фактурами. Навязал вам иконок на выходных.

Промпт для Sora
Создай изображение с набором иконок для мобильных приложений, расположенных в сетке 3 на 3. Каждая иконка должна быть выполнена в виде квадратного значка с закруглёнными углами, визуально имитирующего вязаную текстуру (как крючком или спицами).
Сами иконки — это классические символы: фотоаппарат, чат, человек, письмо, WhatsApp, напоминание, облачность, солнце и дождь.
Иконки должны выглядеть как вязанные — с явно видимой структурой петель.
Фон — белый, иконки яркие, но приглушённые, с аккуратными отступами между ними.
Стилизация должна быть единой для всего сета.


@VAI_ART
#VAI_Gallery
8🔥4👍2
Конец июля немного разродился на релизы.

🔹Wan 2.2 - Новое обновление включает улучшенную реалистичность визуальных деталей, таких как кожа и текстуры, а также более точную стилизацию с настройкой насыщенности и мазков. В видео добавлены плавные переходы, улучшенная временная согласованность и оптимизация памяти для длительных роликов. Спецэффекты нового уровня включают глобальное освещение, динамические частицы и автоматический подбор фильтров. В обучении LoRA ускорена тренировка до 50% быстрее, а также поддерживается few-shot обучение и интеллектуальное объединение моделей. Кросс-модальное творчество позволяет генерировать видео из изображений и извлекать кадры для создания новых изображений с сохранением единой стилистики. В интерфейсе добавлены шаблоны для различных жанров и возможность настройки параметров в реальном времени. Можно протестировать тут. Скинул презентацию в комментарии.

🔹ChatGPT - режим для учёбы.Он не просто даёт ответ, а помогает разбирать задачи по шагам, с вопросами и пояснениями. Работает через диалог, как репетитор. Уже доступен всем, даже в бесплатной версии. OpenAI делали вместе с учителями, чтобы ИИ реально помогал учиться, а не просто подсказывал.

🔹RunWay - про который писал на прошлой неделе. Выпустил свой инструмент Aleph.

🔹Dream Machine - представили свою версию инструмента наподобие RunWay Aleph. Eстественный язык для управления изменениями в рабочих процессах создания визуальных эффектов, рекламы, фильмов и дизайна. Удаление и замена нативных объектов, виртуальные декорации, уточнение персонажей и изменение стиля скоро станут доступны всем подписчикам.

🔹Ideogram представили Ideogram Character — модель согласованности , работающую с одним референсным изображением. На основе которого можно сделать другие изображения, например с тем же лицом и тд. Доступно 10 бесплатных генераций. Это по типу того же Omni Reference в Midjourney. Писал тут.

🔹Photoshop наконец то сделал кнопку сделать хорошо. Добавили функцию Harmonize — функция берет и вписывает объект в сцену. Вот такого ждешь от всех инструментов. Скинул презентацию в комментарии.

🔹NotebookLM теперь можно генерировать анимированные слайды с озвучкой. Выглядит это так: загружаете любые источники, а агент генерирует по ним презентацию + сопроводительный рассказ.Доступно бесплатно. Лимиты такие же, как и для тех самых ИИ-подкастов: 3 в день.

🔹FLUX.1 Krea [dev] - это открытая модель генерации изображений, разработанная Black Forest Labs в сотрудничестве с Krea AI, основанная на архитектуре FLUX.1 [dev] с 12 миллиардами параметров. Модель ориентирована на создание фотореалистичных изображений с уникальной эстетикой, которая включает в себя более естественные текстуры, детализированное освещение и отражения, а также особенности визуального стиля, которые делают изображения отличными от стандартных моделей ИИ. Она минимизирует типичные артефакты, такие как неправильные пропорции или неестественные элементы, и предлагает более выразительные и атмосферные результаты, что выделяет её среди других генеративных моделей.

OpenAI - анонсировали выход GPTGhat 5 и модель с открытыми весами (открытая модель, которую можно поставить локально и бесплатно). Релизы запланированы на ближайшие месяцы.

@VAI_ART
#VAI_News
👍5
Forwarded from эйай ньюз
Genie 3 — SOTA World Model от Google

World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.

Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.

Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.

А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.

Блогпост

@ai_newz
👍4🔥3