VAI
2.77K subscribers
441 photos
75 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Уже показывал, что текст можно делать в любой стилистике. Но решил продемонстрировать еще одну возможность, на примере этих летних логотипов VAI. 🤓

Чтобы лучше контролировать формы, можно изначально скормить ИИ нужный силуэт, а затем уже сделать логотип с нужным наполнением.

Это работает как в Flux Kontext, так и в Sora.

Также работает с кириллицей: в Flux Kontext это работает хуже, потому что он не заточен под это. Бывают ошибки. А вот в Sora — без ошибок и с первого раза.

По традиции, хорошего завершения недели и отличных летних выходных! ❤️

P.S. Решил ввести еще одну рубрику по воскресеньям. Скажите потом, нужно ли это или нет. 🙃

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64
Подборка наиболее важных новостей в ИИ за неделю.

Решил начать вести рубрику по главным новостям недели в ИИ. Начало не особо богатое, но что имеем. Видимо все ушли на летние каникулы и релизов действительно значимых на этой неделе немного.

🔹 RunWay обновили одну из своих лучших фич - RunWay Act, теперь уже версия 2. Улучшен захвата движения, он теперь нового поколения со значительными улучшениями качества и поддержкой отслеживания головы, лица, тела и рук. Закинул в комментарии презентацию этого инструмента.

🔹 ChatGPT Agent — Deep Research и Operator теперь одно целое.
Внутри теперь единая модель которая может пользоваться всеми иснтрументами: текстовый и визуальный браузеры, терминал, прямой API доступ и коннекторы (Gmail, GitHub, etc.) — всё, что раньше жило раздельно в Operator и Deep Research, собрано в одном режиме. Агент теперь умеет заниматься и офисными задачами: генерировать редактируемые презентации и таблицы, обновлять их данными и подтягивать файлы (Docs/Slides/PowerPoint/Sheets) из подключённых облаков.

🔹 Suno v4.5+ — Про Suno уже давно хочу написать, но пока не успел. Один из лучших генераторов музыки и и песен обновился до версии 4.5. Предлагает улучшенную генерацию музыки с расширенными жанрами, более выразительными вокалами, детализированными звуками и улучшенной интерпретацией промтов. Теперь доступны длинные треки до 8 минут, а также новые инструменты, такие как
улучшенные каверы, вокальные оверлеи и генерация музыки по плейлистам. Улучшенная генерация и качество звука позволяют создавать сложные композиции с высокой детализацией и минимальными шумами, делая Suno 4.5 отличной платформой для студийного творчества

@VAI_ART
#VAI_News
👍121
ИИ становится умнее. А безопаснее? 🤖

В последнее время всё чаще слышу, что новые ИИ-модели выходят без должной проверки безопасности.

Почему так? Да потому что в гонке за вниманием важно выйти первым, а вопросы этики и контроля решат «потом».

А что же это значит? Какие риски?

🔹 Генерация вредного контента — ИИ может создать инструкции по оружию или даже призывы к насилию.
🔹 Дезинформация — ИИ генерирует ложь, но с такой уверенностью, как будто это правда.
🔹 Утечки данных и уязвимости — Некачественно проверенный код может привести к реальным угрозам.

Это только часть возможных проблем.

Мы еще не достигли уровня AGI (Artificial General Intelligence), где ИИ мыслит как человек, но даже сейчас видно, как обычная человеческая жадность и стремление к быстрому результату могут привести к определенным последствиям.

Хочется верить, что ИИ станет инструментом, который выведет нас в будущее.

Что будет дальше — покажет время. Но, если честно, это заставляет задуматься… 🤔

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
3👌2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Сейчас таких роликов в сети очень много. Как я уже говорил, инструменты понемногу отходят на второй план, а на первый план выходит идея.

Сколько бы времени ушло на это раньше, если делать всё вручную?🫡

Сделано в Veo3.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👌2
В последнее время одним из художников, которым я особенно вдохновляюсь, стал Альберто Мьельго. Крутой мужик! 💪

Моя любовь к его стилю началась с Человека-паука: Через вселенные. Там сошлось всё — и уникальная стилистика, и сильный сюжет. Потом я увидел его работы для Netflix в Любовь, смерть и роботы — Свидетель, Джибаро. Уже тогда я подумал: «О, как-то это похоже на стиль Человека-паука». Но только позже узнал, что это один и тот же автор.

Отдельно стоит отметить Стеклоочиститель — проект, который он сделал с небольшой командой на коленке и за который получил «Оскар».

В игровой индустрии он тоже успел оставить свой след. Трейлер Watch Dogs: Legion я как-то пропустил и посмотрел только недавно, но Marathon я ждал с интересом. И когда увидел трейлер, сразу подумал: «Похоже на Мьельго». И потом узнал, что он также выступил там автором .

Это невероятно круто и по-настоящему свежее визуальное мышление. 🔥🔥🔥

На работе мы собрали подборку интересных стилистик, которые используем как референсы в производстве — и стиль Мьельго среди них.

Решил попробовать перенести его визуальный язык через ИИ. Получилось не всё, с чем я доволен, но, на мой взгляд, похоже.

@VAI_ART
#VAI_Gallery
8👍3
Forwarded from Data Secrets
О, на всеми любимом YouTube канале 3blue1brown впервые за долгое время вышло новое видео

Тема: диффузионные модели

За 40 минут автор в фирменном мультипликационном стиле буквально раскладывает по полочкам, как работают современные генераторы картинок и видео.

Сначала – основы. CLIP, эмбеддинги, скрытые пространства, архитектура ванильных диффузионных моделей. А потом уже рассказывается и про DDIM, и про устройство Dall E 2, и про conditioning, и про многое другое.

В общем получился довольно подробный ролик. Тем, кто в генерации новичок, посмотреть точно стоит. Профессионалам тоже советуем – чисто насладиться эстетикой 😍

youtu.be/iv-5mZ_9CPY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
На этой неделе ничего очень значительного не произошло, но вышли улучшенные версии уже существующих инструментов.

🔹 Qwen3 обновился. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
По сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Даже Kimi K2 про который писал недавно обходит, причем достаточно неплохо.

🔹 RunWay. Анонсировал инструмент Aleph, который должен появиться на днях. Aleph - это современная модель контекстного видео, открывающая новые горизонты многозадачной генерации визуальных эффектов, позволяющая выполнять широкий спектр операций редактирования исходного видео, таких как добавление, удаление и преобразование объектов, получение новых ракурсов сцены, изменение стиля и освещения, а также множество других задач. Прикрепил презентацию в комментарии.

🔹 Kling AI. Про который уже писал ранее. Kling AI Elements получил обновление. Позволяет генерировать видео на основе 1–4 изображений, автоматически объединяя их в единую динамическую сцену на основе вашей подсказки. Возможность добавлять, удалять или заменять элементы напрямую в интерактивном редакторе без использования внешних инструментов. Значительно улучшены согласованность сюжета, динамика и качество визуального рендеринга.

🔹 Midjourney. Недавно во всеми любимом генераторе ИИ изображений появилась возможность генерировать видео. Писал про него тут. Видео генератор понемногу развивается и обрастает интересными фишками. На этой неделе сделали возможность добавления последнего кадра. Теперь контролировать видео стало легче.

🔹Magnific AI. Новый тип апскейла – Precision (точность) – предлагает настройки для улучшения качества изображений. Уровень резкости, улучшает края и текстуры, повышая визуальную ясность, но высокие значения могут сделать изображение искусственным. Умные края с низкими значениями (7% - 12%) сохраняют оригинальное зерно, подходящее для фотографий или пленки, а высокие значения добавляют художественный или экспериментальный эффект. Настройка Ультра детализация повышает фокусировку и четкость, но при высоких значениях могут появляться артефакты, такие как гало или сдвиги контрастности, что делает изображение более искусственным. В данный момент апскейл работает в 2X, с возможностью увеличения изображения несколько раз.

🔹 Hedra запустили Live Avatars — это технология, позволяющая анимировать 3D-аватары в реальном времени прямо в браузере без установки. Система синхронизирует мимику и движения головы по видео с камеры, работает быстро и точно, поддерживает реалистичные и стилизованные лица, и легко интегрируется через LiveKit API. Это решение идеально для ассистентов и онлайн-презентаций — при этом стоит всего ~$0.05 за минуту, что делает его в десятки раз дешевле аналогов.

🔹ChatGPT. Новость, скорее всего, не новая, но в GPT при редактировании изображений наконец-то улучшили консистентность. Раньше, если просил добавить усы на фото (как пример), то система помимо усов сильно меняла само лицо. Сейчас работает гораздо лучше и практически не изменяет исходное изображение.

Что у вас? Может что - то пропустил? 🧐

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101
Последнее время зарылся в какие-то эксперименты, которые не получается довести до конца.
И тут либо показывать то, что есть — потому что даже на этом этапе ИИ реально помогают в работе, либо ждать, пока инструменты доведут до рабочего состояния и уже показать в полную силу. 🧐
Я выбрал второй вариант. Там реально неплохие штуки, и хочется показать их во всей красе.

Поэтому пачка постов уезжает на неопределённое время в стол.

Нормально. Едем дальше! 💪

Чтобы немного перебить пустоту, покажу интересный способ, как сделать свой пак стикеров (в данном случае на основе своей фотографии).

Делается быстро и без особых проблем.

В Sora пишу такой промпт:

Серия стикеров в пиксель-арт стиле на основе референса. Туда войдут:
– шлёт поцелуй
– влюблённый
– злой
– задумчивый
– показывает язык
– смеётся
Расположи их в виде чёткой сетки с достаточными отступами по вертикали и горизонтали, чтобы стикеры не были обрезаны. Убедись, что стиль стикеров един для всего сета.
Сделай это всё на одном изображении и на прозрачном фоне.


Этим мне Sora и нравится — можно просто писать как техническое задание, а не извращаться с промтингом.

Дальше прогнал через апскейлер. Мне нравится, как работает небольшая программка Upscayl, которая ставится на комп.
Чтобы вытащить что-то не очень шакальное — быстро, очень помогает.

В итоге получаем любой стикерпак за 10 минут.

Помню, как-то на один из проектов надо было делать стикеры для чата — на пак уходило пару дней. Сейчас, с ручными доработками, можно уложиться в полчаса - час.

Пользуйтесь! 🔥🔥🔥

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍6🔥2👌2
Эксперименты с фактурами. Навязал вам иконок на выходных.

Промпт для Sora
Создай изображение с набором иконок для мобильных приложений, расположенных в сетке 3 на 3. Каждая иконка должна быть выполнена в виде квадратного значка с закруглёнными углами, визуально имитирующего вязаную текстуру (как крючком или спицами).
Сами иконки — это классические символы: фотоаппарат, чат, человек, письмо, WhatsApp, напоминание, облачность, солнце и дождь.
Иконки должны выглядеть как вязанные — с явно видимой структурой петель.
Фон — белый, иконки яркие, но приглушённые, с аккуратными отступами между ними.
Стилизация должна быть единой для всего сета.


@VAI_ART
#VAI_Gallery
8🔥4👍2
Конец июля немного разродился на релизы.

🔹Wan 2.2 - Новое обновление включает улучшенную реалистичность визуальных деталей, таких как кожа и текстуры, а также более точную стилизацию с настройкой насыщенности и мазков. В видео добавлены плавные переходы, улучшенная временная согласованность и оптимизация памяти для длительных роликов. Спецэффекты нового уровня включают глобальное освещение, динамические частицы и автоматический подбор фильтров. В обучении LoRA ускорена тренировка до 50% быстрее, а также поддерживается few-shot обучение и интеллектуальное объединение моделей. Кросс-модальное творчество позволяет генерировать видео из изображений и извлекать кадры для создания новых изображений с сохранением единой стилистики. В интерфейсе добавлены шаблоны для различных жанров и возможность настройки параметров в реальном времени. Можно протестировать тут. Скинул презентацию в комментарии.

🔹ChatGPT - режим для учёбы.Он не просто даёт ответ, а помогает разбирать задачи по шагам, с вопросами и пояснениями. Работает через диалог, как репетитор. Уже доступен всем, даже в бесплатной версии. OpenAI делали вместе с учителями, чтобы ИИ реально помогал учиться, а не просто подсказывал.

🔹RunWay - про который писал на прошлой неделе. Выпустил свой инструмент Aleph.

🔹Dream Machine - представили свою версию инструмента наподобие RunWay Aleph. Eстественный язык для управления изменениями в рабочих процессах создания визуальных эффектов, рекламы, фильмов и дизайна. Удаление и замена нативных объектов, виртуальные декорации, уточнение персонажей и изменение стиля скоро станут доступны всем подписчикам.

🔹Ideogram представили Ideogram Character — модель согласованности , работающую с одним референсным изображением. На основе которого можно сделать другие изображения, например с тем же лицом и тд. Доступно 10 бесплатных генераций. Это по типу того же Omni Reference в Midjourney. Писал тут.

🔹Photoshop наконец то сделал кнопку сделать хорошо. Добавили функцию Harmonize — функция берет и вписывает объект в сцену. Вот такого ждешь от всех инструментов. Скинул презентацию в комментарии.

🔹NotebookLM теперь можно генерировать анимированные слайды с озвучкой. Выглядит это так: загружаете любые источники, а агент генерирует по ним презентацию + сопроводительный рассказ.Доступно бесплатно. Лимиты такие же, как и для тех самых ИИ-подкастов: 3 в день.

🔹FLUX.1 Krea [dev] - это открытая модель генерации изображений, разработанная Black Forest Labs в сотрудничестве с Krea AI, основанная на архитектуре FLUX.1 [dev] с 12 миллиардами параметров. Модель ориентирована на создание фотореалистичных изображений с уникальной эстетикой, которая включает в себя более естественные текстуры, детализированное освещение и отражения, а также особенности визуального стиля, которые делают изображения отличными от стандартных моделей ИИ. Она минимизирует типичные артефакты, такие как неправильные пропорции или неестественные элементы, и предлагает более выразительные и атмосферные результаты, что выделяет её среди других генеративных моделей.

OpenAI - анонсировали выход GPTGhat 5 и модель с открытыми весами (открытая модель, которую можно поставить локально и бесплатно). Релизы запланированы на ближайшие месяцы.

@VAI_ART
#VAI_News
👍5