Midjourney, конечно, пока сложно превзойти по художественности — особенно без дообучения моделей. Здесь, с помощью простых манипуляций, можно создавать очень выразительные изображения.🔥 🔥 🔥
Ниже — пример промта и кодов стилей, про которых писал отдельно тут, каждый из которых можно использовать отдельно или комбинировать между собой, получая интересные миксы стилей.
Такие иллюстрации отлично подойдут, например, для детской книги.
@VAI_ART
#VAI_Gallery
Ниже — пример промта и кодов стилей, про которых писал отдельно тут, каждый из которых можно использовать отдельно или комбинировать между собой, получая интересные миксы стилей.
Girl with little brother, on the beach building a big sand castle --ar 3:4 --sref 3257624256::1 3347027050::1 2687112273::1 --niji 6 --style raw --profile 46ulzu7
Такие иллюстрации отлично подойдут, например, для детской книги.
@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤3👍2
Media is too big
VIEW IN TELEGRAM
Что нового?
📌 Обновление значительно улучшило реакцию на подсказки, добавило реалистичную динамику движений и сделало визуал более кинематографичным — с выразительной мимикой, плавными действиями и высокой детализацией даже в сложных сценах.
Также заметно лучше стала работать анимация изображений и фонов (писал тут).
📌 Новый редактор видео: теперь можно загружать 1–5-секундное видео и с помощью текста и изображений легко редактировать его. Можно:
– заменить объекты (например, одежду или персонажа);
– удалить ненужные элементы в сцене;
– добавить что-то новое (например, космический корабль в небо).
📌 Внутренний генератор изображений тоже стал лучше справляться с задачами.
Раз уж заговорили о видео — кратко по рынку:
В начале года видео генераторов стало выходить столько, что почти каждый день появляется новый.
📌Среди них были и локальные решения вроде Hunyuan или WAN — перспективные, но для них нужно или мощное железо, или подключение через API.
📌 Были попытки делать длинные видео до 60 секунд. И хотя визуально они пока «хромают», сам подход интересный — это уже шаг к реальному применению.
📌 OpenAI обновила Sora — та самая модель, от которой поначалу все плевались, но сейчас она реально пригодна для задач.
А Google подтянул Veo 2, добавив крутые штуки вроде inpaint, outpaint и многое другое (писал о нем тут).
Итог: сфера продолжает развивается. Не так быстро, как хотелось бы, но прогресс с начала года уже впечатляющий — и видно, как это всё меняет правила игры. Наблюдаем дальше. Ооочень интересно!
P.S. Загляните в комментарии — там можно посмотреть, как похорошел Уилл Смит с первых генераций и до последних 👀
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
В работе с ИИ часто возникает желание искать сложные пути, пытаться обойти ограничения моделей или придумывать сложные схемы, когда решение лежит на поверхности. На самом деле, многие задачи можно решить быстрее и проще, если грамотно подобрать инструмент.
Не получается в одной модели? Попробуйте другую. Не можете добиться нужного результата? Возможно, стоит изменить сам подход, а не усложнять промт. Сейчас доступно множество инструментов, которые дополняют друг друга, так что не стоит зацикливаться на одном.
Главное — экспериментировать и адаптироваться.🚀
Если есть вопросы — вы всегда можете спросить и узнать путь решения. Отчасти для этого я и создал этот канал — чтобы мы могли общаться и искать решения.🔥
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👌4🔥3👍1
В продолжение предыдущего поста.
Что такое «Глубокое исследование» в ИИ - поисковиках и зачем оно нужно?
Если обычный ИИ - поисковик отвечает на вопрос коротко, то режим глубокого исследования — это уже другой уровень.🔥
Он не просто выдает результат, а погружается в тему, анализирует разные источники, сравнивает точки зрения и строит развернутый, логичный ответ т.е. проводит полное исследование по интересующей теме. Можно уточнять, делить вопрос на части и копать дальше — ИИ не теряет контекст и строит полноценное исследование по шагам.
Зачем это нужно:
● Разобрать сложную тему без большого количества вкладок
● Получить обзор по теме: факты, мнения, источники
● Подготовиться к презентации, докладу, обучению
● Просто изучить что-то новое в глубину, а не по верхам
По сути, это похоже на то, как бы выглядела работа аналитика или исследователя — но выполненная ИИ за короткий промежуток времени.
Плюсы:
● Экономит часы ресерча
● Строит логичную структуру ответа
● Позволяет исследовать тему в формате диалога
● Сохраняет контекст и “думает” вместе с вами
Минусы:
● Может не упомянуть что-то важное (ИИ — не человек)
● Требует уметь задавать хорошие уточняющие вопросы
● Иногда "притягивает" факты — особенно, если нет доступа к проверенным источникам
Где работает:
● Perplexity.ai — нужно переключиться на “Research” (дается 3 исследования в день в бесплатном режиме)
● ChatGPT — можно вести исследование в формате диалога, есть почти во всех версиях, но минус, в том, что возможность только с тарифа Plus, который является платным. Нужно переключиться в режим “Глубокое исследование” Есть модели бесплатные, но они они работают с ограничениями. Например на днях они выпустили новые модели o3 и o4-mini и вторая является бесплатной, там также присутствует “Глубокое исследование” но без доступа к интернету, также нельзя загружать документы для анализа, что является большим минусом.
● DeepSeek — также присутствует данная функция, нужно включить “Глубинное мышление R1”
Лично я пользуюсь только этими, есть и в других сервисах, но так как не пользовался, то писать про них не буду. По сути мне их хватает.
Как и с обычным поисковиком могут возникать некоторые проблемы в плане того, что он может, что то не учесть или додумать, если не найдет источник по какой то дополнительной теме. Но как и в обычном поиске, в исследовании также нужно перепроверять данные, тогда шанс получить неправильную информацию сводится к нулю. Как и любая технология она развивается. Только представьте, что сможете получить исследовательскую структорезированную информацию по любой доступной теме в отчет всего за полчаса!
Такие ИИ уже сейчас могут заменить начальный ресерч, особенно когда нужно разобраться в новой теме быстро, структурировано и без лишнего шума.🔥 🔥 🔥
P.S. Чтобы не пере усложнять пост, добавил один из примеров структуры составления промта для исследования к комментарии.
@VAI_ART
#VAI_General
Что такое «Глубокое исследование» в ИИ - поисковиках и зачем оно нужно?
Если обычный ИИ - поисковик отвечает на вопрос коротко, то режим глубокого исследования — это уже другой уровень.
Он не просто выдает результат, а погружается в тему, анализирует разные источники, сравнивает точки зрения и строит развернутый, логичный ответ т.е. проводит полное исследование по интересующей теме. Можно уточнять, делить вопрос на части и копать дальше — ИИ не теряет контекст и строит полноценное исследование по шагам.
Зачем это нужно:
● Разобрать сложную тему без большого количества вкладок
● Получить обзор по теме: факты, мнения, источники
● Подготовиться к презентации, докладу, обучению
● Просто изучить что-то новое в глубину, а не по верхам
По сути, это похоже на то, как бы выглядела работа аналитика или исследователя — но выполненная ИИ за короткий промежуток времени.
Плюсы:
● Экономит часы ресерча
● Строит логичную структуру ответа
● Позволяет исследовать тему в формате диалога
● Сохраняет контекст и “думает” вместе с вами
Минусы:
● Может не упомянуть что-то важное (ИИ — не человек)
● Требует уметь задавать хорошие уточняющие вопросы
● Иногда "притягивает" факты — особенно, если нет доступа к проверенным источникам
Где работает:
● Perplexity.ai — нужно переключиться на “Research” (дается 3 исследования в день в бесплатном режиме)
● ChatGPT — можно вести исследование в формате диалога, есть почти во всех версиях, но минус, в том, что возможность только с тарифа Plus, который является платным. Нужно переключиться в режим “Глубокое исследование” Есть модели бесплатные, но они они работают с ограничениями. Например на днях они выпустили новые модели o3 и o4-mini и вторая является бесплатной, там также присутствует “Глубокое исследование” но без доступа к интернету, также нельзя загружать документы для анализа, что является большим минусом.
● DeepSeek — также присутствует данная функция, нужно включить “Глубинное мышление R1”
Лично я пользуюсь только этими, есть и в других сервисах, но так как не пользовался, то писать про них не буду. По сути мне их хватает.
Как и с обычным поисковиком могут возникать некоторые проблемы в плане того, что он может, что то не учесть или додумать, если не найдет источник по какой то дополнительной теме. Но как и в обычном поиске, в исследовании также нужно перепроверять данные, тогда шанс получить неправильную информацию сводится к нулю. Как и любая технология она развивается. Только представьте, что сможете получить исследовательскую структорезированную информацию по любой доступной теме в отчет всего за полчаса!
Такие ИИ уже сейчас могут заменить начальный ресерч, особенно когда нужно разобраться в новой теме быстро, структурировано и без лишнего шума.
P.S. Чтобы не пере усложнять пост, добавил один из примеров структуры составления промта для исследования к комментарии.
@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤓1
Советский автопром: каким бы он мог быть сегодня.🔥 🔥 🔥
Продолжаю эксперименты с GPTChat-4o — каждый раз масса эмоций. Удивительно, насколько всё это просто и быстро работает.
В качестве апскейла использовал локальную программу Upscayl.
Промты — максимально понятные: например, «Скрести советскую "Буханку" с Cybertruck», а дальше уже идут уточнения вроде «Сделай перед более угловатым» и т.д.
В результате получаются вполне интересные и оригинальные концепты.
Так как просили больше примеров на практике — завтра покажу, как Upscayl помог мне очень быстро решить одну проблему.🤨
@VAI_ART
#VAI_Gallery
Продолжаю эксперименты с GPTChat-4o — каждый раз масса эмоций. Удивительно, насколько всё это просто и быстро работает.
В качестве апскейла использовал локальную программу Upscayl.
Промты — максимально понятные: например, «Скрести советскую "Буханку" с Cybertruck», а дальше уже идут уточнения вроде «Сделай перед более угловатым» и т.д.
В результате получаются вполне интересные и оригинальные концепты.
Так как просили больше примеров на практике — завтра покажу, как Upscayl помог мне очень быстро решить одну проблему.
@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Как и писал вчера, у меня возникла одна проблема при генерации изображений автомобилей. Видимо, в OpenAI из-за нехватки ресурсов немного снизили качество генерации, и теперь довольно часто появляются шумы. К счастью, их легко убрать с помощью апскейлеров — я уже писал о них раньше. 🔥 🔥 🔥
К сожалению, на текущем этапе, чтобы получить более-менее адекватный результат, часто приходится использовать 2–3 ИИ и немного дорабатывать в Photoshop :)
Также важно понимать, где и как применять конкретный инструмент. Казалось бы, апскейлеров много, но далеко не все подойдут для конкретно такой задачи. Здесь нужно не просто увеличить разрешение, а убрать шумы, при этом сохранив все детали.
С этой задачей отлично справился Upscayl💪 — полностью бесплатный (с некоторыми ограничениями) апскейлер. В нем есть несколько моделей: Ultrasharp, Digital Art и другие. И именно Digital Art хорошо показала себя в случае с иллюстрациями, где нужно сохранить структуру, но убрать артефакты.
Можете сами посмотреть, как круто он с этим справился.😎
@VAI_ART
#VAI_Practice
К сожалению, на текущем этапе, чтобы получить более-менее адекватный результат, часто приходится использовать 2–3 ИИ и немного дорабатывать в Photoshop :)
Также важно понимать, где и как применять конкретный инструмент. Казалось бы, апскейлеров много, но далеко не все подойдут для конкретно такой задачи. Здесь нужно не просто увеличить разрешение, а убрать шумы, при этом сохранив все детали.
С этой задачей отлично справился Upscayl
Можете сами посмотреть, как круто он с этим справился.
@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Почему ИИ так плохо генерирует руки?🤌
Если коротко — нейросеть не понимает, что она рисует. У неё нет представлений вроде: “это кисть, у неё 5 пальцев, вот так она сгибается”.🤓
Всё, что она делает — это угадывает следующую точку на изображении, основываясь на статистике.
Когда ты пишешь в промте “рука”, ИИ лезет в своё латентное пространство и находит «визуальные паттерны», которые чаще всего связаны с этим словом:
● Кожа
● Изгиб
● Пять длинных объектов
● Иногда ногти
Но! Проблема в том, что в обучающей выборке руки — это адская каша :
● Ракурсы
● Скрытые пальцы
● Руки, сливающиеся с фоном
● Руки, закрытые предметами
Что делать?
● Использовать ControlNet (это надстройка над нейросетью, которая позволяет точно управлять композицией изображения с помощью входных данных: позы, контура, глубины и т.д.) с позами и референсами.
● Добавлять уточнения в промт: “hand with 5 fingers, elegant gesture, correct anatomy”.
● Доработать в Photoshop :)
ИИ просто не знает, что пальцев должно быть пять, потому что в данных это не прописано как “правило”.
Он не “понимает”, что два сросшихся пальца — это плохо. Он просто “видел” такое и считает, что это ок.
С усовершенствованием моделей эта проблема становится всё менее заметной, но даже в топовых нейросетях она всё ещё периодически проскакивает.
Пока ИИ не обучен на достаточном количестве референсных рук, их положений, ракурсов и пересечений, такие ошибки будут повторяться.
Но это вопрос времени.
Я думаю, что через несколько итераций модели научатся стабильно распознавать и правильно “собирать” руки.🔥 🔥 🔥
@VAI_ART
#VAI_Notes
Если коротко — нейросеть не понимает, что она рисует. У неё нет представлений вроде: “это кисть, у неё 5 пальцев, вот так она сгибается”.
Всё, что она делает — это угадывает следующую точку на изображении, основываясь на статистике.
Когда ты пишешь в промте “рука”, ИИ лезет в своё латентное пространство и находит «визуальные паттерны», которые чаще всего связаны с этим словом:
● Кожа
● Изгиб
● Пять длинных объектов
● Иногда ногти
Но! Проблема в том, что в обучающей выборке руки — это адская каша :
● Ракурсы
● Скрытые пальцы
● Руки, сливающиеся с фоном
● Руки, закрытые предметами
Что делать?
● Использовать ControlNet (это надстройка над нейросетью, которая позволяет точно управлять композицией изображения с помощью входных данных: позы, контура, глубины и т.д.) с позами и референсами.
● Добавлять уточнения в промт: “hand with 5 fingers, elegant gesture, correct anatomy”.
● Доработать в Photoshop :)
ИИ просто не знает, что пальцев должно быть пять, потому что в данных это не прописано как “правило”.
Он не “понимает”, что два сросшихся пальца — это плохо. Он просто “видел” такое и считает, что это ок.
С усовершенствованием моделей эта проблема становится всё менее заметной, но даже в топовых нейросетях она всё ещё периодически проскакивает.
Пока ИИ не обучен на достаточном количестве референсных рук, их положений, ракурсов и пересечений, такие ошибки будут повторяться.
Но это вопрос времени.
Я думаю, что через несколько итераций модели научатся стабильно распознавать и правильно “собирать” руки.
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤3
Наконец-то добрался до ретекстуринга в Midjourney. 🔥 🔥 🔥
Функция редактирования недавно стала доступна для базового тарифного плана. Помимо ретекстуринга, также стали доступны инпейнт и аутпейнт, а в последних обновлениях появились слои — видимо, Midjourney пытается двигаться в сторону чего-то вроде Photoshop.
Я давно хотел попробовать именно ретекстуринг, и с новым апдейтом это наконец получилось.
С появлением ChatGPT может показаться, что такие функции уже не так актуальны. Но, что удивительно — я протестировал, и GPT постоянно уходит в стилизацию, а это всё же немного другое. Послушность ретекстуринга там, на первый взгляд, ниже, чем в Midjourney.
Поиздевался, над стилевой вариацией своей старой работы.
Про стили, кстати, писал вот здесь.
В целом, ретекстуринг в Midjourney — это не просто игрушка, а действительно полезный инструмент. Он даёт гибкость в работе, особенно когда подключаешь стили — это отличный способ быстро создавать вариации одного и того же объекта под разные запросы и задачи.💪
Ну и, по традиции, хорошего завершения недели и отличных выходных.❤️
P.S. Есть одна крутая новость — расскажу на следующей неделе. За выходные потестирую и всё покажу!
@VAI_ART
#VAI_General
Функция редактирования недавно стала доступна для базового тарифного плана. Помимо ретекстуринга, также стали доступны инпейнт и аутпейнт, а в последних обновлениях появились слои — видимо, Midjourney пытается двигаться в сторону чего-то вроде Photoshop.
Я давно хотел попробовать именно ретекстуринг, и с новым апдейтом это наконец получилось.
С появлением ChatGPT может показаться, что такие функции уже не так актуальны. Но, что удивительно — я протестировал, и GPT постоянно уходит в стилизацию, а это всё же немного другое. Послушность ретекстуринга там, на первый взгляд, ниже, чем в Midjourney.
Поиздевался, над стилевой вариацией своей старой работы.
Про стили, кстати, писал вот здесь.
В целом, ретекстуринг в Midjourney — это не просто игрушка, а действительно полезный инструмент. Он даёт гибкость в работе, особенно когда подключаешь стили — это отличный способ быстро создавать вариации одного и того же объекта под разные запросы и задачи.
Ну и, по традиции, хорошего завершения недели и отличных выходных.
P.S. Есть одна крутая новость — расскажу на следующей неделе. За выходные потестирую и всё покажу!
@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3