VAI
2.77K subscribers
441 photos
75 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Сегодня промт, который делает из любого объекта сложенную из бумаги фигурку.

[Объект] masterfully portrayed through avant-garde minimalist origami paper folding art; the entire form meticulously crafted from a single, vibrant [цвет] sheet of premium paper, intricately folded into elegant, angular geometries that balance precision with artistic flair against a pristine white backdrop. The interplay of sharp creases and flawless edges embodies pure simplicity and meticulous craftsmanship, while nuanced shadows cast by ambient lighting introduce layers of depth and lifelike realism to the sculpted object. The composition strategically employs expansive negative space, enhancing the minimalist aesthetic and allowing the origami creation to breathe and stand out with understated grace. Innovative design elements, such as subtle gradients and delicate paper textures, accentuate the sophistication of the origami technique, highlighting the harmonious fusion of form and function. The overall visual narrative exudes a refined, geometric elegance and a sense of contemporary sophistication, celebrating the timeless artistry of paper folding while embracing modern minimalist sensibilities. This presentation not only showcases the intricate beauty of origami but also conveys a profound appreciation for the art of simplicity, where every fold and angle contributes to a harmonious and visually captivating masterpiece.


На самом деле план был намного круче. Я хотел еще сделать GPTs, который по загруженной картинке объясняет, как можно сложить фигурку самостоятельно. Но не получилось. Поэтому просто наслаждайтесь картинками. 😁

Всех с наступающими длинными выходными (у кого они будут). А я наконец-то почти освободился.

Хорошего дня! ❤️

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🔥3😁1
Forwarded from Data Secrets
HuggingFace релизнули замечательную свежую книгу про обучение LLM

200+ страниц, 7 больших глав. Содержание примерно следующее:

– Архитектуры, их особенности и оптимизация гиперпараметров
– Работа с данными
– Предобучение и какие в нем есть подводные камни
– Пост-трейнинг: все современные подходы и как их применять
– Инфраструктура, как ее правильно строить и оптимизировать

По сути, это готовое хардовое пособие по тому, как с нуля обучить и захостить LLM.

Написано все на довольно простом английском и читается легко + есть куча схем и примеров. В общем, выглядит годно.

huggingface.co/spaces/HuggingFaceTB/smol-training-playbook
🔥3👍2😁21
Новости недели. Давайте кратко пробежимся.

Для начала небольшое отступление. Лично для меня эта неделя значима тем, что два достаточно крупных игрока - Adobe и Figma - основательно занялись ИИ. Первые создали целую экосистему (о которой писал ранее), а вторые купили агрегатор Weavy (достаточно неплохой).
А это значит, что старички понемногу пробуждаются. Из интересного — и те, и другие делают большую ставку на нодовые системы (а-ля ConfUI). К чему это приведёт, увидим позже. Но специалисты, разбирающиеся в нодах, похоже, сейчас будут на волне.

Погнали. 💪

🔹 Minimax Speech 2.6 - это новая версия ИИ-сервиса от MiniMax для преобразования текста в речь. Улучшили качество голоса - он стал ещё естественнее и похож на живой, добавили больше вариантов интонации и стиля (можно делать речь дружелюбной, нейтральной, эмоциональной), ускорили генерацию озвучки и расширили поддержку языков, так что теперь сервис озвучивает тексты быстро, красиво и подходит для любых задач.

🔹 Вышло обновление функции Cameo в Sora 2. Можно добавлять разных персонажей для анимации, а не только себя. Доступно в приложении для IOS и браузере. Презентация в комментариях.

🔹 Gemini Canvas - это новая онлайн-площадка от Google для работы с разными ИИ-моделями. Здесь можно генерировать картинки, текст, видео и презентации, также использовать несколько моделей одновременно.

🔹 Minimax M2 - в компактном размере самой модели: она значительно легче и быстрее большинства аналогов, но при этом сохраняет высокое качество генерации текста, изображений и видео. Благодаря небольшому весу и оптимизации M2 можно запускать даже на обычных компьютерах и облачных сервисах без топовой “железки”, а скорость ответа и обработки заметно выше — это отличный вариант для массового бизнеса, быстрого прототипирования и тех, кто ищет универсальный ИИ без космических затрат на ресурсы. В комментарии закинул график.

🔹 Google запустил Pomelli. Теперь бренды могут просто дать Pomelli ссылку на свой сайт, и система сама проанализирует его: создаст пачку брендированного контента, объединённого творческой идеей для рекламной кампании, всё сразу готово для соцсетей, рекламы и презентаций. Pomelli мгновенно подбирает стиль, музыку, делает видео-нарезки и добавляет нужные эффекты под любую площадку — всё просто, масштабируемо и автоматизировано, без сложных настроек и ручной работы. Презентация в комментариях.

🔹 Вышел Cursor 2.0. Получил собственную агентную модель Composer и новые способы программирования: теперь можно управлять сразу несколькими ИИ-агентами с помощью браузера и голосовых команд, а не только текстом; Composer делает ставку на интерактивность и скорость (обычно решает задачи меньше чем за 30 секунд благодаря быстрому прохождению токенов и параллельным вызовам инструментов). Доступна демо версия редактора. Презентация в комментариях.

🔹 Canva сделала Affinity полностью бесплатным. Весь пакет графических редакторов (аналоги Illustrator, Photoshop и InDesign) теперь доступны всем. Скачать можно тут.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥1
Forwarded from CGIT_Vines (Marvin Heemeyer)
Мне уже несколько человек скинули но у меня только недавно появилось время нормально вдумчиво почитать. Спасибо, кстати, за линки.

Технический художник из Adobe Substance 3D сделал брейкадун своего AI пайплайна по созданию такого четырехногого робота. Процесс описан с создания концепта до финального рига модели. AI применялся только для концептинга, мультивидового разнообразия и самой 3D генерации. Если вы давно читаете канал, то наверняка проходили и сами эти этапы, но тут удобно, что все собрано в одном месте в одном посте.

Автор сам пишет, что сейчас есть много ограничений и финальный результат подходит больше для вторых и третьих планов или для игр с видом топ-даун, что честно говоря уже хорошо.
Цикл производства занял 6 дней, от начала и до конца и это кстати хороший результат для такого качества.

Линк
@CGIT_Vines
👍64
Немного с опозданием, как обычно публикую еженедельную рубрику новостей, которые как по мне сделали предыдущую неделю.

🔹 ComfyUI теперь доступен в облаке - это простой сервис для генерации изображений и видео прямо через браузер, без сложных настроек и мощного ПК, на нодовой основе. Всё, что раньше запускали на локальной машине, теперь работает на мощных серверных GPU, поддерживает более 400 моделей и популярные расширения (LoRA, ControlNet). Планируются новые возможности: загрузка своих моделей, командная работа и API для автоматизации. Теперь ComfyUI — это быстрый доступ к продвинутой генерации графики для творческих задач. Подписка за 20$ в месяц. Презентация в комментариях.

🔹 Kling AI обновили свою генеративную модель изображений: теперь появилась функция мультиреференса - можно загрузить сразу несколько референсов и с их помощью создавать объединённое изображение, комбинируя черты или элементы из всех загруженных источников. Это расширяет возможности для кастомизации результата и творчества.

🔹 Wan 2.2 Animate обновился. Она позволяет создавать движение по референс-видео или заменять персонажа прямо в готовом ролике. Теперь модель лучше передаёт движения тела и выражения лица, поддерживает интеграцию с окружением (освещение, тени, цвета). Всё через простую загрузку картинки и видео. Процесс стал намного быстрее и качественнее: меньше ручных шагов, а итог выглядит более реалистично и согласовано с сценой. Всё открыто и бесплатно, можно запускать локально или онлайн, в любых агрегаторах типа Krea, Weavy и тд. Презентация в комментариях.

🔹 Начались небольшие сливы про Nano Banana 2. Из того что известно вкратце. Профессиональное 2K–4K-качество и серийную генерацию: она умеет объединять до 9 референсов, поддерживает режимы Text→Image и Image→Image, гарантирует консистентность персонажей и стиля во множестве кадров (баннеры, сториборды, серии), быстро работает даже с большими промптами (менее 10 сек) и готовится к мультимодальным задачам (аудио, видео, голосовые референсы).

🔹 Нашел в сети интересный проект MotionStream, в нем можно будет в реалтайме управлять движением объектов в сцене. Пока только проект с описанием, но выглядит очень интересно. Пример в комментариях.

🔹 В llama.cpp завезли WebUI. llama.cpp - это простой опенсорс-движок для локального запуска LLM на обычных CPU, теперь с удобным локальным веб-интерфейсом: легко стартует прямо в браузере, поддерживает более 150 000 моделей, параллельные чаты, загрузку файлов и картинок, экспорт/импорт диалогов, кастомизацию вывода, а также запуск на телефоне за минуту. Инструкция тут.

🔹 В ChatGPT теперь можно редактировать запрос прямо во время выполнения - это удобно для сложных задач, агентных режимов и долгого анализа: не нужно сбрасывать диалог или запускать всё заново, достаточно нажать «Update» в боковой панели и внести нужные поправки, сохраняя прогресс работы модели.

🔹 Не одним DeepSeek единым. Китайцы вообще молодцы в этом плане. Уже писал про Kimi. Сейчас вышла Kimi K2 Thinking. Для глубокой логики: она поддерживает до 200–300 шагов рассуждений без потери качества, справляется с задачами на уровне GPT-5, умеет анализировать длинные цепочки данных и вызывать сторонние инструменты для поиска, вычислений и проверки гипотез. Модель особенно хороша для агентных сценариев, глубокого анализа и сложных задач, работает быстро и доступна бесплатно для всех. Графики в комментариях. Kimi K2 Thinking уже все выходные висит в самом топе моделей HiggingFace.Попробовать можно тут. Ранее я уже писал про бесплатные и простые способы установки моделей на свой компьютер - Kimi K2 Thinking теперь тоже доступна и предустановлена в этих сборках.

Думал, что как только появится больше свободного времени, сразу начну писать посты, но организм решил иначе - сейчас нахожусь в режиме отдыха. Тем не менее, пару постов уже в работе, просто нужно немного больше времени. 💪

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍51
Электроник, но он Т-800 🤖

Результат понравился.

У меня самого есть несколько идей и сюжетов для похожего смешивания миров. Как доберусь - обязательно сделаю что-то подобное.

Автора, к сожалению, найти не удалось. Если кто-то знает, напишите в комментариях - обязательно укажу.

Судя по описанию, работа создана в Midjourney.

@VAI_ART
#VAI_Gallery
👍84🔥1😁1