VAI
2.78K subscribers
440 photos
75 videos
4 files
123 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Уже показывал, что текст можно делать в любой стилистике. Но решил продемонстрировать еще одну возможность, на примере этих летних логотипов VAI. 🤓

Чтобы лучше контролировать формы, можно изначально скормить ИИ нужный силуэт, а затем уже сделать логотип с нужным наполнением.

Это работает как в Flux Kontext, так и в Sora.

Также работает с кириллицей: в Flux Kontext это работает хуже, потому что он не заточен под это. Бывают ошибки. А вот в Sora — без ошибок и с первого раза.

По традиции, хорошего завершения недели и отличных летних выходных! ❤️

P.S. Решил ввести еще одну рубрику по воскресеньям. Скажите потом, нужно ли это или нет. 🙃

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64
Подборка наиболее важных новостей в ИИ за неделю.

Решил начать вести рубрику по главным новостям недели в ИИ. Начало не особо богатое, но что имеем. Видимо все ушли на летние каникулы и релизов действительно значимых на этой неделе немного.

🔹 RunWay обновили одну из своих лучших фич - RunWay Act, теперь уже версия 2. Улучшен захвата движения, он теперь нового поколения со значительными улучшениями качества и поддержкой отслеживания головы, лица, тела и рук. Закинул в комментарии презентацию этого инструмента.

🔹 ChatGPT Agent — Deep Research и Operator теперь одно целое.
Внутри теперь единая модель которая может пользоваться всеми иснтрументами: текстовый и визуальный браузеры, терминал, прямой API доступ и коннекторы (Gmail, GitHub, etc.) — всё, что раньше жило раздельно в Operator и Deep Research, собрано в одном режиме. Агент теперь умеет заниматься и офисными задачами: генерировать редактируемые презентации и таблицы, обновлять их данными и подтягивать файлы (Docs/Slides/PowerPoint/Sheets) из подключённых облаков.

🔹 Suno v4.5+ — Про Suno уже давно хочу написать, но пока не успел. Один из лучших генераторов музыки и и песен обновился до версии 4.5. Предлагает улучшенную генерацию музыки с расширенными жанрами, более выразительными вокалами, детализированными звуками и улучшенной интерпретацией промтов. Теперь доступны длинные треки до 8 минут, а также новые инструменты, такие как
улучшенные каверы, вокальные оверлеи и генерация музыки по плейлистам. Улучшенная генерация и качество звука позволяют создавать сложные композиции с высокой детализацией и минимальными шумами, делая Suno 4.5 отличной платформой для студийного творчества

@VAI_ART
#VAI_News
👍121
ИИ становится умнее. А безопаснее? 🤖

В последнее время всё чаще слышу, что новые ИИ-модели выходят без должной проверки безопасности.

Почему так? Да потому что в гонке за вниманием важно выйти первым, а вопросы этики и контроля решат «потом».

А что же это значит? Какие риски?

🔹 Генерация вредного контента — ИИ может создать инструкции по оружию или даже призывы к насилию.
🔹 Дезинформация — ИИ генерирует ложь, но с такой уверенностью, как будто это правда.
🔹 Утечки данных и уязвимости — Некачественно проверенный код может привести к реальным угрозам.

Это только часть возможных проблем.

Мы еще не достигли уровня AGI (Artificial General Intelligence), где ИИ мыслит как человек, но даже сейчас видно, как обычная человеческая жадность и стремление к быстрому результату могут привести к определенным последствиям.

Хочется верить, что ИИ станет инструментом, который выведет нас в будущее.

Что будет дальше — покажет время. Но, если честно, это заставляет задуматься… 🤔

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
3👌2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Сейчас таких роликов в сети очень много. Как я уже говорил, инструменты понемногу отходят на второй план, а на первый план выходит идея.

Сколько бы времени ушло на это раньше, если делать всё вручную?🫡

Сделано в Veo3.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👌2
В последнее время одним из художников, которым я особенно вдохновляюсь, стал Альберто Мьельго. Крутой мужик! 💪

Моя любовь к его стилю началась с Человека-паука: Через вселенные. Там сошлось всё — и уникальная стилистика, и сильный сюжет. Потом я увидел его работы для Netflix в Любовь, смерть и роботы — Свидетель, Джибаро. Уже тогда я подумал: «О, как-то это похоже на стиль Человека-паука». Но только позже узнал, что это один и тот же автор.

Отдельно стоит отметить Стеклоочиститель — проект, который он сделал с небольшой командой на коленке и за который получил «Оскар».

В игровой индустрии он тоже успел оставить свой след. Трейлер Watch Dogs: Legion я как-то пропустил и посмотрел только недавно, но Marathon я ждал с интересом. И когда увидел трейлер, сразу подумал: «Похоже на Мьельго». И потом узнал, что он также выступил там автором .

Это невероятно круто и по-настоящему свежее визуальное мышление. 🔥🔥🔥

На работе мы собрали подборку интересных стилистик, которые используем как референсы в производстве — и стиль Мьельго среди них.

Решил попробовать перенести его визуальный язык через ИИ. Получилось не всё, с чем я доволен, но, на мой взгляд, похоже.

@VAI_ART
#VAI_Gallery
8👍3
Forwarded from Data Secrets
О, на всеми любимом YouTube канале 3blue1brown впервые за долгое время вышло новое видео

Тема: диффузионные модели

За 40 минут автор в фирменном мультипликационном стиле буквально раскладывает по полочкам, как работают современные генераторы картинок и видео.

Сначала – основы. CLIP, эмбеддинги, скрытые пространства, архитектура ванильных диффузионных моделей. А потом уже рассказывается и про DDIM, и про устройство Dall E 2, и про conditioning, и про многое другое.

В общем получился довольно подробный ролик. Тем, кто в генерации новичок, посмотреть точно стоит. Профессионалам тоже советуем – чисто насладиться эстетикой 😍

youtu.be/iv-5mZ_9CPY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
На этой неделе ничего очень значительного не произошло, но вышли улучшенные версии уже существующих инструментов.

🔹 Qwen3 обновился. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
По сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Даже Kimi K2 про который писал недавно обходит, причем достаточно неплохо.

🔹 RunWay. Анонсировал инструмент Aleph, который должен появиться на днях. Aleph - это современная модель контекстного видео, открывающая новые горизонты многозадачной генерации визуальных эффектов, позволяющая выполнять широкий спектр операций редактирования исходного видео, таких как добавление, удаление и преобразование объектов, получение новых ракурсов сцены, изменение стиля и освещения, а также множество других задач. Прикрепил презентацию в комментарии.

🔹 Kling AI. Про который уже писал ранее. Kling AI Elements получил обновление. Позволяет генерировать видео на основе 1–4 изображений, автоматически объединяя их в единую динамическую сцену на основе вашей подсказки. Возможность добавлять, удалять или заменять элементы напрямую в интерактивном редакторе без использования внешних инструментов. Значительно улучшены согласованность сюжета, динамика и качество визуального рендеринга.

🔹 Midjourney. Недавно во всеми любимом генераторе ИИ изображений появилась возможность генерировать видео. Писал про него тут. Видео генератор понемногу развивается и обрастает интересными фишками. На этой неделе сделали возможность добавления последнего кадра. Теперь контролировать видео стало легче.

🔹Magnific AI. Новый тип апскейла – Precision (точность) – предлагает настройки для улучшения качества изображений. Уровень резкости, улучшает края и текстуры, повышая визуальную ясность, но высокие значения могут сделать изображение искусственным. Умные края с низкими значениями (7% - 12%) сохраняют оригинальное зерно, подходящее для фотографий или пленки, а высокие значения добавляют художественный или экспериментальный эффект. Настройка Ультра детализация повышает фокусировку и четкость, но при высоких значениях могут появляться артефакты, такие как гало или сдвиги контрастности, что делает изображение более искусственным. В данный момент апскейл работает в 2X, с возможностью увеличения изображения несколько раз.

🔹 Hedra запустили Live Avatars — это технология, позволяющая анимировать 3D-аватары в реальном времени прямо в браузере без установки. Система синхронизирует мимику и движения головы по видео с камеры, работает быстро и точно, поддерживает реалистичные и стилизованные лица, и легко интегрируется через LiveKit API. Это решение идеально для ассистентов и онлайн-презентаций — при этом стоит всего ~$0.05 за минуту, что делает его в десятки раз дешевле аналогов.

🔹ChatGPT. Новость, скорее всего, не новая, но в GPT при редактировании изображений наконец-то улучшили консистентность. Раньше, если просил добавить усы на фото (как пример), то система помимо усов сильно меняла само лицо. Сейчас работает гораздо лучше и практически не изменяет исходное изображение.

Что у вас? Может что - то пропустил? 🧐

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101
Последнее время зарылся в какие-то эксперименты, которые не получается довести до конца.
И тут либо показывать то, что есть — потому что даже на этом этапе ИИ реально помогают в работе, либо ждать, пока инструменты доведут до рабочего состояния и уже показать в полную силу. 🧐
Я выбрал второй вариант. Там реально неплохие штуки, и хочется показать их во всей красе.

Поэтому пачка постов уезжает на неопределённое время в стол.

Нормально. Едем дальше! 💪

Чтобы немного перебить пустоту, покажу интересный способ, как сделать свой пак стикеров (в данном случае на основе своей фотографии).

Делается быстро и без особых проблем.

В Sora пишу такой промпт:

Серия стикеров в пиксель-арт стиле на основе референса. Туда войдут:
– шлёт поцелуй
– влюблённый
– злой
– задумчивый
– показывает язык
– смеётся
Расположи их в виде чёткой сетки с достаточными отступами по вертикали и горизонтали, чтобы стикеры не были обрезаны. Убедись, что стиль стикеров един для всего сета.
Сделай это всё на одном изображении и на прозрачном фоне.


Этим мне Sora и нравится — можно просто писать как техническое задание, а не извращаться с промтингом.

Дальше прогнал через апскейлер. Мне нравится, как работает небольшая программка Upscayl, которая ставится на комп.
Чтобы вытащить что-то не очень шакальное — быстро, очень помогает.

В итоге получаем любой стикерпак за 10 минут.

Помню, как-то на один из проектов надо было делать стикеры для чата — на пак уходило пару дней. Сейчас, с ручными доработками, можно уложиться в полчаса - час.

Пользуйтесь! 🔥🔥🔥

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍6🔥2👌2