VAI
2.78K subscribers
440 photos
75 videos
4 files
123 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Forwarded from CGIT_Vines (Marvin Heemeyer)
Мне уже несколько человек скинули но у меня только недавно появилось время нормально вдумчиво почитать. Спасибо, кстати, за линки.

Технический художник из Adobe Substance 3D сделал брейкадун своего AI пайплайна по созданию такого четырехногого робота. Процесс описан с создания концепта до финального рига модели. AI применялся только для концептинга, мультивидового разнообразия и самой 3D генерации. Если вы давно читаете канал, то наверняка проходили и сами эти этапы, но тут удобно, что все собрано в одном месте в одном посте.

Автор сам пишет, что сейчас есть много ограничений и финальный результат подходит больше для вторых и третьих планов или для игр с видом топ-даун, что честно говоря уже хорошо.
Цикл производства занял 6 дней, от начала и до конца и это кстати хороший результат для такого качества.

Линк
@CGIT_Vines
👍64
Немного с опозданием, как обычно публикую еженедельную рубрику новостей, которые как по мне сделали предыдущую неделю.

🔹 ComfyUI теперь доступен в облаке - это простой сервис для генерации изображений и видео прямо через браузер, без сложных настроек и мощного ПК, на нодовой основе. Всё, что раньше запускали на локальной машине, теперь работает на мощных серверных GPU, поддерживает более 400 моделей и популярные расширения (LoRA, ControlNet). Планируются новые возможности: загрузка своих моделей, командная работа и API для автоматизации. Теперь ComfyUI — это быстрый доступ к продвинутой генерации графики для творческих задач. Подписка за 20$ в месяц. Презентация в комментариях.

🔹 Kling AI обновили свою генеративную модель изображений: теперь появилась функция мультиреференса - можно загрузить сразу несколько референсов и с их помощью создавать объединённое изображение, комбинируя черты или элементы из всех загруженных источников. Это расширяет возможности для кастомизации результата и творчества.

🔹 Wan 2.2 Animate обновился. Она позволяет создавать движение по референс-видео или заменять персонажа прямо в готовом ролике. Теперь модель лучше передаёт движения тела и выражения лица, поддерживает интеграцию с окружением (освещение, тени, цвета). Всё через простую загрузку картинки и видео. Процесс стал намного быстрее и качественнее: меньше ручных шагов, а итог выглядит более реалистично и согласовано с сценой. Всё открыто и бесплатно, можно запускать локально или онлайн, в любых агрегаторах типа Krea, Weavy и тд. Презентация в комментариях.

🔹 Начались небольшие сливы про Nano Banana 2. Из того что известно вкратце. Профессиональное 2K–4K-качество и серийную генерацию: она умеет объединять до 9 референсов, поддерживает режимы Text→Image и Image→Image, гарантирует консистентность персонажей и стиля во множестве кадров (баннеры, сториборды, серии), быстро работает даже с большими промптами (менее 10 сек) и готовится к мультимодальным задачам (аудио, видео, голосовые референсы).

🔹 Нашел в сети интересный проект MotionStream, в нем можно будет в реалтайме управлять движением объектов в сцене. Пока только проект с описанием, но выглядит очень интересно. Пример в комментариях.

🔹 В llama.cpp завезли WebUI. llama.cpp - это простой опенсорс-движок для локального запуска LLM на обычных CPU, теперь с удобным локальным веб-интерфейсом: легко стартует прямо в браузере, поддерживает более 150 000 моделей, параллельные чаты, загрузку файлов и картинок, экспорт/импорт диалогов, кастомизацию вывода, а также запуск на телефоне за минуту. Инструкция тут.

🔹 В ChatGPT теперь можно редактировать запрос прямо во время выполнения - это удобно для сложных задач, агентных режимов и долгого анализа: не нужно сбрасывать диалог или запускать всё заново, достаточно нажать «Update» в боковой панели и внести нужные поправки, сохраняя прогресс работы модели.

🔹 Не одним DeepSeek единым. Китайцы вообще молодцы в этом плане. Уже писал про Kimi. Сейчас вышла Kimi K2 Thinking. Для глубокой логики: она поддерживает до 200–300 шагов рассуждений без потери качества, справляется с задачами на уровне GPT-5, умеет анализировать длинные цепочки данных и вызывать сторонние инструменты для поиска, вычислений и проверки гипотез. Модель особенно хороша для агентных сценариев, глубокого анализа и сложных задач, работает быстро и доступна бесплатно для всех. Графики в комментариях. Kimi K2 Thinking уже все выходные висит в самом топе моделей HiggingFace.Попробовать можно тут. Ранее я уже писал про бесплатные и простые способы установки моделей на свой компьютер - Kimi K2 Thinking теперь тоже доступна и предустановлена в этих сборках.

Думал, что как только появится больше свободного времени, сразу начну писать посты, но организм решил иначе - сейчас нахожусь в режиме отдыха. Тем не менее, пару постов уже в работе, просто нужно немного больше времени. 💪

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍51
Электроник, но он Т-800 🤖

Результат понравился.

У меня самого есть несколько идей и сюжетов для похожего смешивания миров. Как доберусь - обязательно сделаю что-то подобное.

Автора, к сожалению, найти не удалось. Если кто-то знает, напишите в комментариях - обязательно укажу.

Судя по описанию, работа создана в Midjourney.

@VAI_ART
#VAI_Gallery
👍84🔥1😁1
Как насчёт того, чтобы большие посты сразу дублировать аудиодорожкой для прослушивания?
Anonymous Poll
33%
Круто!
38%
Без разницы
32%
Бла-бла-бла… Хоть бы уже что-нибудь выпустили, Лёх, а то одни обещания
4
Конец недели, подведем итоги интересных новинок в сфере ИИ. Новостей не много, но пройдемся. ⚡️

🔹 QWEN Camera Angles. Обновили интересный инструмент, который позволяет управлять положением и углом “камеры” при создании или генерации изображений с помощью AI.Можно попробовать на агрегаторах типа WeavyAI. Запустили также в Hugging Face space. Помнит еще кто то про каталог ИИ там?). А сам инструмент от QWEN можно посмотреть тут. Потестил, не всегда работает хорошо, но в общем можно сделать нужные ракурсы. Презентация в комментариях.

🔹 В chatGPT скоро появятся групповые чаты. Групповые чаты в GPT - это возможность нескольким людям общаться с одним ботом в одном чате одновременно. Все участники видят вопросы и ответы, могут вместе обсуждать темы, задавать вопросы, решать задачи или работать над проектом. Такой формат уже тестируется в некоторых сервисах (например, в ChatGPT Team и Slack-плагинах), но пока не везде доступен. Идея, чтобы бот помогал не одному человеку, а сразу всей группе в режиме живого диалога. Хз как это будет устроено, лично у меня чаты даже при небольшом общении начинают сильно виснуть и лагать и приходятся создавать новые. А тут будет целая группа людей, которая заполнит этот чат моментально. В общем, посмотрим.
Также вышла GPT 5.1, но нет смысла много писать. Так как из основных обновлений, сделали разговор более “теплым” 😀 и немного обновили thinking режим.

🔹 ElevenLabs Scribe v2 Realtime - это новый сервис для преобразования речи в текст. Можно просто диктовать через микрофон или загружать аудио/видео-файл - и сразу получать текстовую расшифровку. Поддерживает 92 языка, работает быстро и очень точно, подходит для интервью, роликов, разговоров или просто заметок голосом. Всё максимально просто: говоришь - получаешь текст. Презентация в комментариях.

🔹 Многие писали про новый генератор миров от стартап Фей-Фей Ли, по названием Marble. Marble - это 3D‑генератор, с которым можно создавать мир и ходить по нему. В отличие от Genie, здесь мир не меняется сам, но его можно дорабатывать по запросу или объединять с другими. Работает с текстом, картинками, видео и простыми 3D‑набросками. Генерация проходит по шагам: сначала создается основа мира, потом добавляются детали и оформление. Из интересных особенностей полученный мир можно выгрузить мешами в 3д или видео. Есть бесплатный тариф. Попробовать можно тут. Презентация в комментариях.

🔹 Google NotebookLM - это ИИ-инструмент для работы с заметками и исследованиями: загружаешь свои документы, он делает быстрые резюме, отвечает на вопросы с цитатами из твоих файлов и помогает создавать учебные материалы. Новая функция Deep Research позволяет автоматически искать инфу в интернете и формировать подробные отчёты. Всё удобно, ответы ссылаются на исходные материалы, но факт-чекинг всё равно нужен.
Пишут, что очень удобная штука. Сам не пробовал, но очень заинтересовали, обязательно посижу в нем. Сам Deep Research лично у меня не раскатали. Как понял, это должно произойти со дня на день.

В начале следующей недели планируется как минимум один пост из практической серии - о том, как создавался прототип игры. Начал с концептов персонажей. Пост получился объёмным, надеюсь, не слишком перегруженным.

Всем заранее отличной недели! 🐤

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍6
Начну серию практических постов.

Пока неясна периодичность, потому что пишу это не быстро, а свободное время постоянно стремится к нулю. Но точно до конца года выйдет что‑то ещё из этой серии.

Начну с концептов персонажей.

Есть много способов создать персонажа - как с нуля, так и на основе уже имеющихся референсов. Здесь, как и в обычном концепт‑арте, всё зависит от навыков.

Рассмотрим одни из самых простых способов.

Пока что, по моим наблюдениям, есть три способа получить результат:

1️⃣ Отталкиваться от промта. Самый абстрактный вариант, но даже так можно получить варианты, способные натолкнуть на интересные идеи. У меня много раз было так: просто описываешь, что хочешь получить, не имея чёткого видения, и итоговые генерации дают решения, которые помогают сформировать финальную концепцию.
2️⃣ Использование референсных изображений. ИИ без проблем подбирает нужный стиль. Можно добавить промт, чтобы подчеркнуть желаемую стилистику. Промт также создаётся через ИИ(можно закинуть референсное изображение и попросить вычленить стилистические особенности) и дорабатывается вручную.
3️⃣ Работа с наработками (например, скетчем). Можно отрисовать определённый дизайн или детали и дорабатывать их, двигаясь в нужную сторону.

⚡️В моём случае для прототипа я использовал два последних способа: брал свои наработки и референсные изображения, а затем на их основе делал концепт персонажа. Делал это через Sora - по‑моему, до сих пор это один из самых простых способов доработать нужную стилистику. Закинул референсы и примерно описал, что хочу получить.

Получив первый концепт, который уже более менее подходил я отправил его в языковую модель (у меня это был GPT). Затем забрал промт с характерным стилем, доработал его и закинув вместе с концептом получил серию изображений одного персонажа.

Доработал их вручную - это занимает не так много времени. Где-то немного поправил глаза, где-то уменьшил или увеличил объём персонажа. Иногда совмещал части одного персонажа с другим, иногда дорисовывал необходимые детали. Поскольку это этап концепта, делать всё вручную не сложно.

Всё довольно просто: понятно, что и концепты выходят достаточно простые, но суть та же и в более сложных задачах - просто появляется больше работы/итераций.

🍌 Дальше я использовал второй инструмент - Nano Banana. С его помощью я дорабатывал детали и доводил рендер до нужного качества.

У Nano Banana есть свои плюсы и минусы. После нескольких месяцев работы нашёл и сильные, и слабые стороны. Если интересно, могу написать отдельный пост, но вот-вот должна выйти вторая версия этого сервиса, поэтому накопленный опыт уже устареет. 🙂

В целом, все эти манипуляции заменяют огромный пласт ручной работы.

В данном случае важно было получить интересный образ персонажа с долей сумасшествия и щепоткой милоты, ведь для тела была заранее создана болванка, а его форма не играет принципиальной роли.

Кстати, и сам сумасшедший/милый образ, и болванка тела были продуманы по‑особому, но это уже нюансы нашей ниши - оффлайн VR со свободным перемещением. Если интересно, почему и для чего такое делается, могу рассказать об этом отдельно.

Обвесы, как пример, на последнем изображении, их планируется много.

Пишите, что интересно, а что нет - буду смотреть по вашим откликам.

Дальше пойдём по плану: поговорим о создании 3D по получившимся концептам. И дальше, уже разберём концепты и модели локаций.

Все концепты суммарно были сделаны за пару дней(это с ручными доработками, обвесами и тд.). В примерах процентов 40 из того, что было сделано.

Давайте обсудим! Что думаете? Может, у вас есть свои методы и пайплайны - будет интересно узнать что‑то новое.💪

P.S. Набросок черепахи с первого изображения был нарисован крутым художником и арт директором Олегом Юрковым.

ТГ
Арстанция

P.P.S. Аудиоверсия в комментариях.

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍196🔥2🦄2
Ну что, Gemini 3 от Google вышла - по бенчмаркам новый король! В ближайшее время ждём Nano Banana 2, её тоже должны подвезти, ведь она на базе Gemini 3. Бесплатно, но с дневными ограничениями. Нужен VPN.

@VAI_ART
#VAI_News
👍41
Data Secrets
HuggingFace релизнули замечательную свежую книгу про обучение LLM 200+ страниц, 7 больших глав. Содержание примерно следующее: – Архитектуры, их особенности и оптимизация гиперпараметров – Работа с данными – Предобучение и какие в нем есть подводные камни…
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Недавно делился книгой по обучению LLM от HuggingFace - теперь появился её перевод. Я по образованию программист, всегда интересно не только пользоваться, но и разбираться, как устроено всё “под капотом”. Времени хватает не всегда, но пусть будет под рукой - надеюсь доберусь почитать, ну а если кому-то тоже пригодится, отлично!

Перевел ее Сергей Долгов.

@VAI_ART
#VAI_News
5👍2🔥1
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥 Все уже в курсе, но если кто‑то ещё не знает - вышла Nano Banana Pro.

🔹 объединяет до 14 референсов в одно изображение
🔹 поддерживает разрешение до 4K
🔹 ещё лучше переносит стили, контроль над результатом стал круче
🔹 улучшена работа с текстом, поддержка русского тоже есть


И это только малая часть возможностей Nano Banana Pro.

Во многих сервисах она уже доступна, в том числе здесь и здесь.

Пока сам не тестировал, но по доступным примерам видно - управлять и получать нужный результат стало еще проще.

Осталось только датчики к голове прикрутить, чтобы не писать промпты. 😁

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21