VAI
2.99K subscribers
441 photos
76 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Midjourney, конечно, пока сложно превзойти по художественности — особенно без дообучения моделей. Здесь, с помощью простых манипуляций, можно создавать очень выразительные изображения.🔥🔥🔥

Ниже — пример промта и кодов стилей, про которых писал отдельно тут, каждый из которых можно использовать отдельно или комбинировать между собой, получая интересные миксы стилей.
Girl with little brother, on the beach building a big sand castle --ar 3:4 --sref 3257624256::1 3347027050::1 2687112273::1 --niji 6 --style raw --profile 46ulzu7


Такие иллюстрации отлично подойдут, например, для детской книги.

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍2
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥Сегодня наконец-то произошло что-то интересное в мире видео генераторов. И речь не только о моём любимце, но и о признанном фаворите — Kling обновился до версии 2.0. Минус в том, что доступ к новой модели есть только у платных пользователей. У меня на одном из аккаунтов есть кредиты, но всё равно пишет, что для использования требуется подписка на платный тариф.

Что нового?

📌 Обновление значительно улучшило реакцию на подсказки, добавило реалистичную динамику движений и сделало визуал более кинематографичным — с выразительной мимикой, плавными действиями и высокой детализацией даже в сложных сценах.
Также заметно лучше стала работать анимация изображений и фонов (писал тут).
📌 Новый редактор видео: теперь можно загружать 1–5-секундное видео и с помощью текста и изображений легко редактировать его. Можно:
– заменить объекты (например, одежду или персонажа);
– удалить ненужные элементы в сцене;
– добавить что-то новое (например, космический корабль в небо).
📌 Внутренний генератор изображений тоже стал лучше справляться с задачами.

Раз уж заговорили о видео — кратко по рынку:

В начале года видео генераторов стало выходить столько, что почти каждый день появляется новый.

📌Среди них были и локальные решения вроде Hunyuan или WAN — перспективные, но для них нужно или мощное железо, или подключение через API.
📌 Были попытки делать длинные видео до 60 секунд. И хотя визуально они пока «хромают», сам подход интересный — это уже шаг к реальному применению.
📌 OpenAI обновила Sora — та самая модель, от которой поначалу все плевались, но сейчас она реально пригодна для задач.
А Google подтянул Veo 2, добавив крутые штуки вроде inpaint, outpaint и многое другое (писал о нем тут).

Итог: сфера продолжает развивается. Не так быстро, как хотелось бы, но прогресс с начала года уже впечатляющий — и видно, как это всё меняет правила игры. Наблюдаем дальше. Ооочень интересно!🔥🔥🔥

P.S. Загляните в комментарии — там можно посмотреть, как похорошел Уилл Смит с первых генераций и до последних 👀

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
🟥🟥🟥 Не усложняйте там, где можно проще.

В работе с ИИ часто возникает желание искать сложные пути, пытаться обойти ограничения моделей или придумывать сложные схемы, когда решение лежит на поверхности. На самом деле, многие задачи можно решить быстрее и проще, если грамотно подобрать инструмент.

Не получается в одной модели? Попробуйте другую. Не можете добиться нужного результата? Возможно, стоит изменить сам подход, а не усложнять промт. Сейчас доступно множество инструментов, которые дополняют друг друга, так что не стоит зацикливаться на одном.

Главное — экспериментировать и адаптироваться.🚀

Если есть вопросы — вы всегда можете спросить и узнать путь решения. Отчасти для этого я и создал этот канал — чтобы мы могли общаться и искать решения.🔥

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👌4🔥3👍1
В продолжение предыдущего поста.

Что такое «Глубокое исследование» в ИИ - поисковиках и зачем оно нужно?

Если обычный ИИ - поисковик отвечает на вопрос коротко, то режим глубокого исследования — это уже другой уровень.🔥

Он не просто выдает результат, а погружается в тему, анализирует разные источники, сравнивает точки зрения и строит развернутый, логичный ответ т.е. проводит полное исследование по интересующей теме. Можно уточнять, делить вопрос на части и копать дальше — ИИ не теряет контекст и строит полноценное исследование по шагам.

Зачем это нужно:

● Разобрать сложную тему без большого количества вкладок
● Получить обзор по теме: факты, мнения, источники
● Подготовиться к презентации, докладу, обучению
● Просто изучить что-то новое в глубину, а не по верхам

По сути, это похоже на то, как бы выглядела работа аналитика или исследователя — но выполненная ИИ за короткий промежуток времени.

Плюсы:

● Экономит часы ресерча
● Строит логичную структуру ответа
● Позволяет исследовать тему в формате диалога
● Сохраняет контекст и “думает” вместе с вами

Минусы:

● Может не упомянуть что-то важное (ИИ — не человек)
● Требует уметь задавать хорошие уточняющие вопросы
● Иногда "притягивает" факты — особенно, если нет доступа к проверенным источникам

Где работает:

Perplexity.ai — нужно переключиться на “Research” (дается 3 исследования в день в бесплатном режиме)
ChatGPT — можно вести исследование в формате диалога, есть почти во всех версиях, но минус, в том, что возможность только с тарифа Plus, который является платным. Нужно переключиться в режим “Глубокое исследование” Есть модели бесплатные, но они они работают с ограничениями. Например на днях они выпустили новые модели o3 и o4-mini и вторая является бесплатной, там также присутствует “Глубокое исследование” но без доступа к интернету, также нельзя загружать документы для анализа, что является большим минусом.
DeepSeek — также присутствует данная функция, нужно включить “Глубинное мышление R1”

Лично я пользуюсь только этими, есть и в других сервисах, но так как не пользовался, то писать про них не буду. По сути мне их хватает.

Как и с обычным поисковиком могут возникать некоторые проблемы в плане того, что он может, что то не учесть или додумать, если не найдет источник по какой то дополнительной теме. Но как и в обычном поиске, в исследовании также нужно перепроверять данные, тогда шанс получить неправильную информацию сводится к нулю. Как и любая технология она развивается. Только представьте, что сможете получить исследовательскую структорезированную информацию по любой доступной теме в отчет всего за полчаса!

Такие ИИ уже сейчас могут заменить начальный ресерч, особенно когда нужно разобраться в новой теме быстро, структурировано и без лишнего шума.🔥🔥🔥

P.S. Чтобы не пере усложнять пост, добавил один из примеров структуры составления промта для исследования к комментарии.

@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤓1
Ну и немного юмора на вечер пятницы.😁 Отличных выходных всем!

@VAI_ART
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3😁31
Советский автопром: каким бы он мог быть сегодня.🔥🔥🔥

Продолжаю эксперименты с GPTChat-4o — каждый раз масса эмоций. Удивительно, насколько всё это просто и быстро работает.

В качестве апскейла использовал локальную программу Upscayl.

Промты — максимально понятные: например, «Скрести советскую "Буханку" с Cybertruck», а дальше уже идут уточнения вроде «Сделай перед более угловатым» и т.д.
В результате получаются вполне интересные и оригинальные концепты.

Так как просили больше примеров на практике — завтра покажу, как Upscayl помог мне очень быстро решить одну проблему.🤨

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Как и писал вчера, у меня возникла одна проблема при генерации изображений автомобилей. Видимо, в OpenAI из-за нехватки ресурсов немного снизили качество генерации, и теперь довольно часто появляются шумы. К счастью, их легко убрать с помощью апскейлеров — я уже писал о них раньше. 🔥🔥🔥

К сожалению, на текущем этапе, чтобы получить более-менее адекватный результат, часто приходится использовать 2–3 ИИ и немного дорабатывать в Photoshop :)
Также важно понимать, где и как применять конкретный инструмент. Казалось бы, апскейлеров много, но далеко не все подойдут для конкретно такой задачи. Здесь нужно не просто увеличить разрешение, а убрать шумы, при этом сохранив все детали.

С этой задачей отлично справился Upscayl 💪— полностью бесплатный (с некоторыми ограничениями) апскейлер. В нем есть несколько моделей: Ultrasharp, Digital Art и другие. И именно Digital Art хорошо показала себя в случае с иллюстрациями, где нужно сохранить структуру, но убрать артефакты.

Можете сами посмотреть, как круто он с этим справился.😎

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Почему ИИ так плохо генерирует руки?🤌

Если коротко — нейросеть не понимает, что она рисует. У неё нет представлений вроде: “это кисть, у неё 5 пальцев, вот так она сгибается”.🤓

Всё, что она делает — это угадывает следующую точку на изображении, основываясь на статистике.

Когда ты пишешь в промте “рука”, ИИ лезет в своё латентное пространство и находит «визуальные паттерны», которые чаще всего связаны с этим словом:

● Кожа
● Изгиб
● Пять длинных объектов
● Иногда ногти

Но! Проблема в том, что в обучающей выборке руки — это адская каша :

● Ракурсы
● Скрытые пальцы
● Руки, сливающиеся с фоном
● Руки, закрытые предметами

Что делать?

● Использовать ControlNet (это надстройка над нейросетью, которая позволяет точно управлять композицией изображения с помощью входных данных: позы, контура, глубины и т.д.) с позами и референсами.
● Добавлять уточнения в промт: “hand with 5 fingers, elegant gesture, correct anatomy”.
● Доработать в Photoshop :)

ИИ просто не знает, что пальцев должно быть пять, потому что в данных это не прописано как “правило”.
Он не “понимает”, что два сросшихся пальца — это плохо. Он просто “видел” такое и считает, что это ок.

С усовершенствованием моделей эта проблема становится всё менее заметной, но даже в топовых нейросетях она всё ещё периодически проскакивает.
Пока ИИ не обучен на достаточном количестве референсных рук, их положений, ракурсов и пересечений, такие ошибки будут повторяться.

Но это вопрос времени.
Я думаю, что через несколько итераций модели научатся стабильно распознавать и правильно “собирать” руки.🔥🔥🔥

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍113
Наконец-то добрался до ретекстуринга в Midjourney. 🔥🔥🔥

Функция редактирования недавно стала доступна для базового тарифного плана. Помимо ретекстуринга, также стали доступны инпейнт и аутпейнт, а в последних обновлениях появились слои — видимо, Midjourney пытается двигаться в сторону чего-то вроде Photoshop.

Я давно хотел попробовать именно ретекстуринг, и с новым апдейтом это наконец получилось.

С появлением ChatGPT может показаться, что такие функции уже не так актуальны. Но, что удивительно — я протестировал, и GPT постоянно уходит в стилизацию, а это всё же немного другое. Послушность ретекстуринга там, на первый взгляд, ниже, чем в Midjourney.

Поиздевался, над стилевой вариацией своей старой работы.
Про стили, кстати, писал вот здесь.

В целом, ретекстуринг в Midjourney — это не просто игрушка, а действительно полезный инструмент. Он даёт гибкость в работе, особенно когда подключаешь стили — это отличный способ быстро создавать вариации одного и того же объекта под разные запросы и задачи. 💪

Ну и, по традиции, хорошего завершения недели и отличных выходных. ❤️

P.S. Есть одна крутая новость — расскажу на следующей неделе. За выходные потестирую и всё покажу!

@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3