VAI
3K subscribers
441 photos
76 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Сделал быстрые тесты нового Hitem3D v1.5. Что можно сказать: по сравнению с предыдущей версией, как уже писал, он действительно стал лучше держать форму, добавили детализации и, самое главное, появились текстуры.

Из минусов - иногда детализация оказывается излишней и превращается в шум. На портретах форму лучше держит Sparc3D, а пальма выглядит аккуратнее в Hunuan3D - именно из-за того, что в Hitem3D детализация начинает портить меш и работает не в его пользу.

В целом это хорошее обновление, инструмент можно использовать для работы.

Интересно, что ситуация похожа на 2D-генераторы: под каждую задачу приходится выбирать отдельный ИИ - один лучше в одном, другой в другом.

Сейчас собираю прототип локации, и постоянно приходится переключаться между сервисами. Хочется уже чего-то универсального, а не десятки инструментов, которыми приходится жонглировать. Кстати, часть объектов сделал вообще в Tripo3D - неожиданно, но на определенных задачах версия 2.5 (последняя 3-я версия) показала себя лучше остальных ИИ.

@VAI_ART
#VAI_Practice
👍84🤝2
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥Последнее время заметил одну тенденцию: как только на рынке появляется какой-то новый инструмент, в ближайшие недели появляется куча аналогов. Причём работающих достаточно неплохо. С чем это связано — непонятно. Либо индустрия ИИ смотрит в одну сторону, и это просто совпадение. Либо на волне хайпа другие студии тоже пытаются отхватить немного внимания. Но во втором случае возникает вопрос: почему инструменты получаются достаточно качественными? Ведь за неделю вряд ли можно сделать что-то нормальное.

Это я к чему. Banana вышла всего две недели назад, а за это время уже появился третий инструмент с редактированием и неплохим качеством. На прошлой неделе вышел Seedream 4.0 — ИИ от TikTok. А вчера Reve обновилась и теперь тоже заявляет, что умеет редактировать. И, судя по примерам, делает это неплохо. (Если кто забыл, писал о ней вот тут.). Под капотом Claude для лучшего понимания запросов.

В отличие от Seedream 4.0, у Reve есть бесплатные генерации.

Пробуйте!

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥Ну, чтобы сразу не отходить, вышел Hunyuan3D в версии 3.0. Давно его ждал. 😱

Hunyuan3D 3.0 от Tencent — новая версия генератора 3D-моделей, которая значительно повысила точность геометрии (заявляют рост качества в три раза по сравнению с предыдущими версиями) и теперь доступна через комплексное решение Hunyuan 3D Studio, позволяющее пройти весь путь от концепта до анимации. Инструмент нацелен на то, чтобы удешевить и ускорить классический 3D-пайплайн, предлагая создание более детализированных ассетов и снижение ручной работы.

Когда это все тестировать, чисто риторический вопрос)

Тесты нужны?)

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥21
Конец недели, снова подводим итоги. Последние недели были очень загруженными — нужно было сделать много всего. Сейчас легче не стало, но, по крайней мере, основную часть работы я уже сделал. За это время попробовал в работе много новых инструментов. Постараюсь на следующей неделе подробнее рассказать, что и как получилось — опыт оказался очень интересным.

И так, на неделе было:

🔹 Многими любимый и в то же время многими не любимый ComfyUI решил выйти в онлайн. Поддерживается работа на мощных GPU — то есть теперь можно будет пользоваться им удалённо, на мощном железе, и, конечно же, не бесплатно .🙂 Пока доступен только лист ожидания.

🔹 Вышла новая версия Hunyuan3D — обновились до третьей. Улучшили передачу форм, повысили детализацию. В целом, один из самых сильных ИИ для 3D продолжает радовать и развиваться. Писал выше о нем.

🔹 Reve обновлял сайт и модель, которая теперь может и в редактирование изображений. Писал тут.

🔹 Luma Dream Machine представили новую модель генерации видео.Ray3 — это новая видеомодель, которая сочетает логическое мышление с генерацией HDR студийного уровня. Поддерживает 4K HDR (10–16 бит). Ray2 в свое время показывал неплохой результат в анимации. Я почитал людей, которые шарят за эту тему и по их словам модель разочаровала.

🔹 Mozart AI. Новый музыкальный сервис умеет генерировать и редактировать треки по текстовому промпту, референсу или кусочку аудио, поддерживает выбор провайдера (ElevenLabs или SongGen), создание отдельных партий и даже импровизацию на выделённом участке. В качестве референса можно указывать конкретного исполнителя или песню (правда, с «опасными» вариантами вроде RHCP иногда пусто). Внутри есть библиотека сэмплов и простая DAW с мультитреком и фильтрами. Экспорт доступен в WAV и MIDI с глубиной 16/24/32 бит, стемы обещают позже. На старте дают миллион кредитов, и после генераций баланс всё ещё полный — фактически сервис бесплатный. Закинул в комментарии презентацию.

🔹 Ну и сразу следующая новость. Suno, один из лучших ИИ в области музыки, скоро обновится до пятой версии. Очень интересно, какие новые возможности они добавят.

🔹 OpenAI выпустили GPT-5 Codex. Создана специально для программистов. Она умеет быстро и точно писать код по описанию, находить ошибки, предлагать улучшения, делать полноценный код-ревью и даже анализировать большие проекты. Codex поддерживает разные уровни сложности задач: может выдавать быстрые ответы на простые запросы или глубоко анализировать сложные системы. Работает в связке с IDE, терминалом и другими инструментами разработчиков, что делает его мощным помощником в реальных проектах.

🔹 Lucy Edit . Очередной редактор видео, но лично на мой взгляд вся технология еще настолько сырая, что годится только для создания локальных мемов. В комментария добавил презентацию.

🔹 Wan 2.2 14B Animate . Модель видео-диффузии от Wan AI, которую научили анимировать персонажей: ты даёшь фото персонажа + видео с движениями, и модель либо заставляет фото персонажа двигаться как в видео, либо заменяет персонажа в видео твоим персонажем. Она умеет точно копировать выражения лица и движения, сохранять стиль освещения и цвета сцены, что делает результат выглядящим натурально и красиво. С виду работает хорошо. Презентация в комментариях.

Может что-то упустил? 🤔

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥1🎉1
Последние несколько недель очень занят, уже писал, оправдываю пустоту тут в постах).

Хочу сделать пару заметок. Пока не могу показать сам результат, так как он не личный, а коммерческий.

Мы взялись делать новую игру, и раз уж всё новое, то решили начать применять процессы, выстроенные максимально через ИИ. Надо же когда-то начинать.

Было много интересного. Например, я первый раз получил полноценный концепт локации через генерации. Раньше ИИ делали кашу из объектов, и сложно было сделать что-то логичное. Но тут при использовании Sora и NanoBanana всё получилось. Не идеально (думаю, если ещё помучить его, можно было сделать прям хорошо, но я не стал заморачиваться), в любом случае лично для меня это прорыв.

Дальше персонажи и концепты. Сразу скажу, что мы немного пробовали делать концепты с разными художниками, но не очень получалось. Тут, возможно, мой косяк, так как не смог полностью передать идею. В связке Sora и Banana всё получилось. Более чем хорошо, лично я результатом концептов персонажей доволен. К посту прикреплены одни из получившихся.

Ну и самое интересное для меня, так как я изначально 3D-шник, это было попробовать всё это сгенерировать в 3D.

По персонажам было смоделировано тело, так как тела имеют одинаковый размер, и это важный момент. Но тут один раз сделал, и дальше немного меняй типы лап и т.д. Головы же генерировал, и они получились отлично. Мимика, характер, попадание - очень хорошие. Это один из самых важных моментов: попасть в характер, всё остальное уже больше технические моменты.

Ну и, соответственно, локация. Прототип был собран за 2 недели. Это от идеи «давайте начинать делать» и до финала. Все объекты с концепта получилось сгенерировать: что-то проще, что-то сложнее, некоторые вещи пришлось делить на подобъекты. Но всё получилось. А с умной ретопологией от Hunuyan и Tripo даже получилось сетку оптимизировать. Развёртка - да, всё ещё плохо. Но тут можно переразвёрнуть и перезапечь с одной модели на другую, то есть проблема не критичная. Конечно это все надо будет доводить до ума. Если получится, то покажу все как доработаем и выпустим.

Итого: 2,5 недели - и есть рабочий прототип локации и два персонажа. Раньше, если бы мне кто-то сказал про такое, я бы пальцем покрутил у виска, а сейчас это наши реалии. И инструменты будут только развиваться.

Ещё момент: часто читаю, что что-то не получается, и поэтому инструмент 💩. Но писал об этом уже давно, ещё раз продублирую: ИИ - это не волшебная палочка, а инструмент, который нужно изучать. Часто многие забывают про это.

Нужны более подробные разборы процессов?

P.S. Всем замечательных выходных! ❤️

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥136💩2👌1
Прошла неделе, а это значит, что подводим итоги. Неделя была неплохая по релизам, давайте кратко пройдемся.

🔹Вышла новая модель Qwen-3-Omni. универсальная модель от Alibaba, которая понимает и генерирует текст, работает с изображениями, кодом, а ещё умеет воспринимать аудио и видео. Проще говоря, это «всё-в-одном» ИИ, который может анализировать разные типы данных одновременно: от обычного текста и картинок до голосовых сообщений и видеороликов. Модель сделали быстрой и компактной, чтобы её можно было запускать не только в облаке, но и локально. Попробовать можно тут.

🔹 Kling обновился до версии 2.5. Сейчас обещают создание более плавные и реалистичные видео по тексту или картинке. Улучшенную передачу движения, сделали анимацию естественнее и добавили поддержку высокого качества кадров. Проще говоря, Kling 2.5 позволяет быстро получить сочные, кинематографичные ролики, которые выглядят ближе к настоящим, а не к «сырой» анимации из прошлых моделей. По тестам, что я видел, не все так гладко. Презентация в комментариях. Также закинул пример нейрогимнастики, которая теперь выглядит достаточно неплохо.

🔹 Suno, который и так впереди всех конкурентов на голову, обновился до версии 5.Это модель, которая умеет генерировать полноценные песни по текстовому запросу, референсу или загруженному фрагменту трека. В новой версии улучшили качество звучания, вокал стал более живым, а аранжировки — разнообразнее. Проще говоря, Suno 5 делает музыку ещё ближе к профессиональной студийной записи, так что экспериментировать с созданием треков стало удобнее и интереснее.

🔹 Вышла новая версия открытой модели Wan 2.5. это обновлённая версия генератора видео от Wan AI, которая стала быстрее и стабильнее, а главное — научилась выдавать более детализированные и плавные ролики. Модель лучше справляется с движением персонажей, камерой и сложными сценами, сохраняя целостность объектов и стиля. Проще говоря, Wan 2.5 позволяет получать качественные кинематографичные видео, которые выглядят естественнее и ближе к настоящей съёмке. Можно протестировать тут.

🔹За последнее время обновились все топовые генераторы по 3d. Так произошло и с Rodin Gen-2. Это модель для 3D-генерации, которая умеет превращать изображения или текстовые описания в полноценные трёхмерные объекты с формой и текстурами. В новой версии улучшили детализацию, сделали геометрию чище и добавили больше реализма в материалы. Проще говоря, Rodin Gen-2 позволяет быстро получать готовые 3D-модели для игр, анимации или визуализации без долгого ручного моделинга.

🔹 ИИ понемногу переходят в целые сервисы, которые обещают полностью закрывать потребности в своей сфере. Так произошло с Hunyuan Studio и Suno Studio. Первые обещают закрывать полный пайплайн по 3d, вторые по созданию музыки/песен. Пока выглядит сомнительно, но по крайней мере понятно направление куда это все планирует развиваться. Закинул обе презентации в комментарии.

🔹 HunyuanImage 3.0 — это новая версия генератора картинок от Tencent, которая стала работать быстрее и точнее: изображения получаются более детализированными, с лучшей анатомией и естественным светом. Модель поддерживает разные стили — от реализма до анимации, умеет работать с текстовыми описаниями и референсами. Проще говоря, HunyuanImage 3.0 позволяет создавать более качественные и «живые» картинки без долгих доработок. Протестировать можно тут.

🔹 Google выпустили инструмент "Learn Your Way". Это персонализированный репетитор, который поможет вам усвоить любую тему. Протестировать можно тут.

🔹 OpenAI в ближайшее время грозятся выпустить несколько новых продуктов. Все оч. ждут Sora 2. Надеюсь так оно и будет. Так как Sora уже под устарела, а работает очень хорошо.

🔹 Один из проектов, которые OpenAI обозначили это ChatGPT – Pulse. Новая функция от OpenAI, которая делает ChatGPT не просто «на запрос», а сверх-ассистентом: каждый день модель сама собирает по твоим разговорам, подключённым приложениям (календарь, почта) и интересам визуальные карточки с полезными обновлениями — новости, идеи, напоминания. Пока только на Pro аккаунтах.

@VAI_ART
#VAI_News
👍96
Вчера было немного времени, посидел с позами. Как же круто, что не нужно ничего выставлять - просто говоришь «поставь в такую позу», и он делает. Да, некоторые детали могут теряться, но в целом это всё равно очень круто.

Показал примеры и решили попробовать поставить детских персонажей в позы персонажей из другой нашей игры. Ну я и попробовал - всё работает.

Оружие я подгрузил отдельной картинкой и попросил заменить.

Как же это всё упрощает жизнь!

И речь не только про концепты же. Нужна на фотографии другая поза. Закинул пример и все готово 🫡.

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83👎1🤯1
🟥🟥🟥Король умер - да здравствует новый король! Вышел Claude 4.5 Sonnet. По таблице видно, что он обходит все предыдущие модели, даже GPT-5.

Платный и нужен VPN.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥 Вышла Sora 2!

Большую часть своей работы я делаю на базе генератора изображений в Sora. Будет очень интересно посмотреть, на что способна новая версия. Если ее довезут)

Качество видео очень сильно прокачали. Добавили генерацию звука, липсинг и тд. Уровень, конечно, нужно еще будет тестировать. Так как после первой версии остался маленький осадок. Когда они выкатили очень сырую версию.

Пока США и Канада.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍43🥴2
Пока все отходят от новой Sora 2 😁. Давайте поговорим на другую достаточно интересную тему.

Я думаю, многие слышали про Perplexity - это поисковик на основе ИИ. Достаточно неплохой, который включает в себя разные последние модели.

Я долго ждал выхода нормального ИИ-браузера для автоматизации и параллельно следил за Comet. Вставал в вэйт-лист, но доступа так и не дали. А на про-аккаунт за 100$ было жалко денег. По итогу его выкатили без крупных новостей для бесплатных пользователей (по крайней мере мне доступ дали). Зашел на днях в поисковик, и там появилась кнопка "Скачать новый браузер". На радостях сразу скачал.
Несколько дней смотрел, изучал.

Могу сказать, что браузеры выходят на новый уровень. 😱

Я периодически пишу в основных постах про новые ИИ-системы, и Comet как раз является такой. Да, подобные решения уже были и у Microsoft, и у Opera, но отличие Comet в том, что за привычной браузерной структурой (схожей с Firefox/Chrome) скрывается агентная прослойка. Она позволяет мгновенно выполнять не только стандартные команды, но и сложные автоматизации на сайтах, с файлами, сервисами - как будто у вас под рукой всегда личный умный ассистент.

● хотите отправить письмо? Просто пишите в чате "отправь письмо тому-то, прикрепи такой-то файл". И письмо отправляется. Конечно же перед этим надо дать доступы к почте.
● хотите забронировать столик? Пишите, где и как, и он сам бронирует столик.
● мне нужно было найти шарф, и я попросил найти все решения в Яндекс.Маркете по определённым характеристикам и цене. 2 минуты, и можно заказывать, не тратя время на поиски.
● нужно изменить, структуризировать Google Таблицу? Просто скидываете ссылку и описываете, что нужно сделать. Я сидел и смотрел, как ассистент меняет таблицу по моим требованиям. Как будто сидишь в машине с автопаркингом.


Это только малое количество того, что можно реализовать через агентскую систему.

Круто, что это всё делается прямо в браузере.

Конечно же, скорее всего, есть и минусы, но пока я их не обнаружил.

Кто-то знает подобные решения в браузерах?

Я знаю про плагины типа Cursor и т.д. Также знаю, что в LLM можно искать информацию и использовать частично как поисковик, а также структуризировать, но это всё идёт как отдельные решения, а тут всё сложилось в одну среду.

0 рекламы. Как обычно, просто делюсь интересными решениями в области ИИ.

В общем, я пока под впечатлением! 😎

P.S. Также ниже проведу опрос про агентов.

@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥31
Вы пользуетесь агентами? Если да, расскажите, для чего именно и какие используете.
Anonymous Poll
15%
Да
61%
Нет
22%
Что это?
8%
Лех, опять какие то опросы! Делом лучше займись!
Короткая рубрика: в этот раз новостей за неделю немного.

🔹 Sora 2 вышла. Одна из значимых новостей недели. Всю неделю все говорили только про неё.
Кстати, получить код доступа можно очень легко. Сейчас в группах их раздают просто так. Так как 1 код можно использовать до 4 пользователей. Если нужно скину ссылки групп, где можно взять себе код для использования Sora 2.
В общем OpenAI открыли свой тик ток. С кучей вирусных и залипательных роликов. Sora по одному короткому запросу делает готовый контент, с монтажом, озвучкой, логикой.
Много интересного видел, обучали ее скорее всего вообще на всем, что есть в интернете, так как она знает практически все.
Пока, лично для, меня это больше для развлечения и все внутри там сделано так, чтобы люди сидели генерировали и скролили залипательные видео. Конечно энтузиасты нашли сразу и практические применения. Но, с виду, OpenAI делали ставку именно на вирусный контент.
Конечно при правильном развитии, это все может стать очень крутым инструментов в будущем, но тут главный вопрос - хочет ли этого OpenAI.
Также уже появилась про версия с 1080p и с увеличенным таймингом до 15 секунд.

🔹 Claude Sonnet 4.5 - это новая версия искусственного интеллекта от Anthropic, созданная для разговоров, письма и анализа. Он стал быстрее, точнее и умнее предыдущих моделей, лучше понимает контекст, может писать тексты, код, резюмировать документы и рассуждать сложнее, чем раньше. Работает плавно, отвечает естественно и максимально приближен к человеческому стилю общения. Писал тут. Видно, что обходит почти все существующие модели по многим параметрам. Как мне написал в комментариях, можно опробовать в Perplexity.

🔹 Ну и сразу в продолжение. Perplexity выпустили в общий доступ свой браузер Comet. Вижу, что многие не заценил, но это пока). Писал тут.

Видимо, остальные компании на этой неделе решили не лезть под каток Sora 2 и отложили свои релизы на более спокойное время - поэтому интересных новостей оказалось не так много.

@VAI_ART
#VAI_News
👍93
Все ещё разгребаю задачи - совсем нет времени что-то писать, но я обязательно вернусь💪! Череда очень большого количества релизов, которые нужно закрыть.

В последнее время, как и говорил, активно внедрил ИИ в рабочие процессы. Есть много интересного, что хочу рассказать, как хорошего, так и не очень.
Спасибо, что всё ещё здесь ❤️

Конец недели - а значит, время для нашей традиционной рубрики новостей!

🔹 От OpenAI еще немного релизов. Например они выпустили Agent Kit. Это инструмент от OpenAI, который помогает разработчикам создавать «агентов» - программы, которые могут не просто отвечать на вопросы, но и автоматически выполнять задачи, работать с внешними инструментами и координировать сложные сценарии

🔹 Также OpenAI открыли доступ по API (то есть можно подключить функции напрямую в свои приложения или сайты) для Sora 2 и GPT-5 Pro. Также OpenAI подключают крупных партнеров для создания контента текстовыми командами. Одни из Figma и Canva. Figma, кстати, так же на неделе подключила r себе в среду Nanobanana.

🔹 Gemini 2.5 Computer Use - новая модель от Google, способная управлять веб-браузером как человек: заполнять формы, кликать кнопки, прокручивать страницы и работать внутри интерфейсов, где нет API.
Она доступна через Gemini API / Vertex AI и позиционируется как инструмент для создания агентов, которые взаимодействуют с UI напрямую, а не через код.

🔹 Veo 3.1 - грядущее обновление модели генерации видео от Google, замеченное в коде Vertex AI и в листах ожидания Higgsfield AI.
Оно обещает улучшенную согласованность персонажей, длительность роликов до минуты и новые кинематографические пресеты, что считается попыткой конкурировать с Sora от OpenAI. Презентация в комментариях.

🔹 Вышел Grok Imagine 0.9 - это обновлённая версия инструмента от xAI, который превращает текстовые запросы или изображения в анимированные видеоклипы (обычно до 6–15 секунд) с синхронизированным звуком и визуальными эффектами. Есть бесплатные генерации.

🔹 Ну и как писал уже череда редакторов, которых после NanoBanana появилось уже много. DreamOmni2 - это новая модель, которая понимает и обрабатывает и изображения, и текстовые инструкции одновременно, чтобы делать две вещи: редактировать изображение по указаниям + образцу и генерировать новые изображения, ориентируясь как на текст, так и на визуальный пример. Опенсорс, тут можно найти исходники. А тут можно протестировать. Презентация в комментариях.

🔹 В NanoBanana наконец то подвезли аспетрейшен (разные соотношение сторон). Ну и Google написали, что теперь модель работает еще лучше и качественней. Сами признались, что в начале были проблемы. Много сейчас в ней делаю, и есть о чём рассказать. Доберусь - обязательно напишу.

🔹 Не про ИИ, но тоже про технологии. Вышел новый гуманоид для дома, офиса и вообще куда угодно - Figure 03. Универсальный бытовой гуманоид, который способен выполнять множество задач в доме, что делает его более амбициозным, чем большинство предшественников.
В общем, теперь покупаем не робот-пылесос, а гуманоидного помощника, который и посуду помоет, и пропылесосит, и пыль протрёт.
Видео - в комментариях

Вообще, по ощущениям, всё очень сильно ускоряется. До конца года ходят слухи и о выпуске Sora 3, и Nanobanana 2, и многое другое.
Большие корпорации выходят на сверхзвуковые скорости, стараясь захватить как можно больше рынка - от этого уже начинает кружиться голова.
Если раньше между крупными релизами проходило полгода или год, то теперь все намного быстрее.
Похоже, ставки в конкурентной гонке растут, и компании ускоряются, пока кто-нибудь не сорвётся, а победитель не займёт хорошую нишу.
В общем, до конца года, будет еще очень и очень много всего интересного. Ждем…

@VAI_ART
#VAI_News
👍53
This media is not supported in your browser
VIEW IN TELEGRAM
Нашёл интересное видео на просторах интернета - перенос стиля и повышения детализации через Wan 2.2.

А у нас как раз сейчас есть задача, где нужно подобное решение. Вовремя!

@VAI_ART
#VAI_Notes
👍123🤮1
Я догораю на работе, но уже виден просвет. Еще 1-2 недели и я снова с вами, в строю. Посты продолжатся в ближайшее время🤓. Для затравки: за 1,5 месяца в планах было сделать 3 играбельных прототипа для наших новых режимов и игр-ещё не всё успели, но уже сделали большую часть. Глаз дергается, но я сам, честно, в “лёгком” афиге от того, что сейчас это вообще возможно.

В этом мире изменчиво всё, кроме одного-рубрики новостей про ИИ здесь. Быстро пробежимся.

🔹 Google интегрировала Nano Banana в Google Search и NotebookLM. Теперь ИИ-генератор изображений доступен не только в Gemini.
NotebookLM-бесплатный AI-помощник на базе Gemini, который работает с вашими файлами (до 50 источников: PDF, Docs, YouTube, ссылки), анализирует их, делает краткие пересказы, FAQ, ментальные карты и даже аудиоподкасты-всегда с точными ссылками на оригиналы.

🔹 Gemini 3 скоро (в октябре). Это один из релизов, который до конца года еще много шумихи наделает. Она создана как часть семейства Gemini, которое объединяет самые современные AI-технологии компании, включая мультимодальные возможности. Если простым языком, то это LLM модель от Google, которая объединяет все их ИИ сервисы. Та же Nano Banana работает на базе 2.5 Gemini. Представляете, что будет в третьей версии? Слухов очень много о ее возможностях. Один из скинул в комментарии.

🔹 Вышла Veo 3.1. Обновленная версия модели генерации видео от Google, теперь поддерживает ввод текста, изображений и даже видео-кадров, генерирует ролики высокой чёткости (до 1080 p) длительностью до~1 минуты и включает улучшенное управление сценой, персонажами и аудио. Доступна на всех агрегаторах по-типу Krea или Weavy

🔹 OpenAI, выпустили Sora Storyboard-это функция в видеоредакторе Sora 2 от OpenAI, которая превращает вашу видео-генерацию в понятную панельную систему: вы задаёте отдельные сценыт или кадры, настраиваете время и переходы, и инструмент собирает их в единую историю. Попытка сделать генерацию более управляемой и гибкой. Доступна только на тарифе Pro для бояр.

🔹 RunWay решила сосредоточиться на создании приложений, которые упаковывают ключевые рабочие процессы в готовые решения под конкретные задачи пользователей. Все приложения уже доступны в веб-версии, и компания обещает, что коллекция будет пополняться каждую неделю-превращая Runway в полноценную платформу для быстрой и интуитивной генерации визуального контента. Презентация в комментариях.

🔹 Anthropic выпустили Claude Haiku 4.5.Мини-версия Claude в новом поколении. Не самая мощная, но при этом даже побивает GPT-5 по некоторым характеристикам.
Alibaba также строчит свои модели чуть ли не каждую неделю и на этой выпустили. Небольшую модель на 4B и 8B параметров. Модели можно легко запустить локально на компьютере и до обучить. А по характеристикам они уже близки к их флагманской модели Qwen2.5-VL-72B.
Тут больше новость про то, что технологии развиваются, и находятся всё новые способы обучения и упаковки моделей. Это позволяет создавать их дешевле и быстрее.

🔹 Manus 1.5 теперь делает задачи почти в 4 раза быстрее-в среднем за 4 минуты вместо 15. Качество выросло примерно на 15%, а пользователи стали довольнее. Добавили безлимитный контекст, возможность работать вместе в одной сессии и общее хранилище файлов. Самое интересное-агент теперь может по одному запросу собрать и запустить полноценное веб-приложение с сервером, базой данных, авторизацией, аналитикой и встроенным ИИ. Если не врут, то тут даже есть бесплатный триал.

🔹 В обновлении Windows 11 появился встроенный ИИ-помощник Copilot. Теперь его можно вызвать голосом или через панель задач. Он умеет искать файлы, запускать программы, отвечать на вопросы по содержимому экрана и даже выполнять различные действия. Microsoft сделала Copilot частью системы, чтобы управлять компьютером можно было просто с помощью запросов.

🔹Google наконец-то добавил в свой поисковик ИИ-режим. Под капотом работает их флагманская модель Gemini 2.5, которая анализирует запрос, разбивает его на подтемы и выдаёт готовые, понятные ответы вместо простого списка ссылок.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍5
Новости предыдущей недели, немного с запозданием. Кратенько.

🔹OpenAI выпустили свой браузер Atlas. Не везде они впереди, а во многих направлениях в догоняющих. Ничего нового они не показали. Тот же Comet как по мне лучше. И да, пока только для Macos.

🔹 Hailuo Minimax 2.3. Сам сайт. Обновлённая модель генерации видео, которая лучше удерживает стиль и композицию исходного кадра, естественнее передаёт мимику и крупные планы, и даёт выбор между качественным и быстрым режимами для разных задач, вроде рекламных роликов и продуктовых демо с реалистичным светом, панорамами и глубиной резкости. Должен выйти со дня на день. Пример в комментариях.

🔹 Hitem3D. Один из лучших 3d генераторов обновился до версии v1.5_1536 Pro. Пишут что Print-ready. Не успел протестировать.Если тестировали, то скиньте в комментарии посмотреть.

🔹 Magnific. Апсейкейлер обновился до 2-ой версии. По примерам, которые видел очень неплохо достает детализацию в изображениях.

🔹 Писал в прошлый раз про RunWay , то, что они начали упаковывать ключевые рабочие процессы в готовые решения под конкретные задачи пользователей. Сейчас представили функционал формирования рабочих процессов на борде. Пока только для бояр, которые платят много денег. Чуть позже обещают на всех раскатать.Пример в комментариях.

🔹 Suno. Один из лучших генераторов музыки. Выпустили новую версию, которую открыли для всех, даже для бесплатных пользователей. Есть дневные ограничения. Кто не пробовал, самое время. Версия v4.5-all. Презентация в комментариях.

🔹 Krea Realtime 14B - это новое «реалтайм» видео‑ядро на 14 млрд параметров: генерирует дольше и стабильнее, держит поток с меньшим дрейфом, быстрее выводит первый кадр и кадры в секунду, поддерживает живой рестайл/правки «на лету», и открыто распространяется с репозиторием для локального запуска; в сравнении с ранними реалтайм‑версами Krea, где были меньшие модели и короткие, менее стабильные клипы, новая даёт более детальную картинку, устойчивые длинные шоты и управляемость в режиме стрима. Пример в комментариях.

🔹 Вышла DeepSeek - OCR - это современная нейросеть для распознавания текста, которая может считывать и переводить печатные или рукописные слова с фотографий, сканов и картинок. Она работает быстро и довольно точно, умеет находить текст даже на сложных или криво снятых изображениях, поддерживает много языков, а также может извлекать текст из документов, квитанций, книг и вывесок. Всё делается автоматически: просто загружаешь картинку, а на выходе получаешь чистый текст. Доступна в основной модели. Нужно только обновиться.

Всем крутой недели! 💪 А мой марафон подходит к концу. Со следующей недели возвращаюсь!

@VAI_ART
#VAI_News
👍86
This media is not supported in your browser
VIEW IN TELEGRAM
Прошла конференция «Adobe Max», на которой показали много интересного. Радует, что хоть кто-то из старожилов нормально включается в гонку ИИ. Большинство до сих пор делает вид, что ничего не происходит.

Кратко пройдемся по новинкам.

1️⃣ Персональные Firefly
Теперь можно обучить Firefly под свой фирменный стиль — даже для компаний и брендов.
2️⃣ Другие ИИ напрямую в Adobe
Generative Fill теперь может рисовать через Firefly, Google Gemini Flash Image (NanoBanana), FLUX Kontext и т.д. — выбирайте любой стиль генерации.
3️⃣ Firefly 5 — новое поколение генерации картинок!
Теперь ИИ-арт не только мегадетализированный и фотореалистичный, но и «послойный»: можно сразу по слоям двигать, менять и тонко редактировать. Всё в 4Мп!
4️⃣ Видео:
В Premiere Pro — магия с масками: ИИ сам отслеживает нужный объект и даёт применять эффекты за пару кликов. Появились автоформаты для YouTube Shorts с эффектами.
5️⃣ AI-ассистенты в Photoshop и Express
Больше не ищем вручную инструменты — пишем или говорим: «Сделай ярче», «Замени фон», «Подбери шрифт» — ассистент сам всё делает как надо!
6️⃣ Фото:
В Lightroom автоотбор лучших кадров; в Photoshop — умная гармонизация вставленных объектов (чтобы «вписался»), генеративное до-восстановление деталей и апскейл до 4K/56Мп. Интеграция с топовыми моделями от Topaz Labs.
7️⃣ Firefly теперь озвучит и озвучку и музыку
ИИ пишет музыкальные треки под видео (темп, настроение, длительность — всё сам), а ещё переводит текст в речь с реалистичными голосами.

Из больших минусов, что все это не работает на пиратских версиях 😁.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍21