ИИ для редактирования изображений.
Так, давайте пройдемся по ИИ для редактирования изображений. Думаю, нужно подсобрать всё. Сейчас у нас есть очень неплохой набор инструментов, которые могут помочь в реализации широкого спектра задач — как для работы, так и для личных целей.🫡
Что именно у нас есть из инструментов сейчас:
GPTChat — работает в платном тарифе, но есть бесплатные генерации с ограничениями каждый день.
Flux.Kontext — на данный момент представлена в 3 моделях: две доступны через агрегаторы и являются платными, одна (самая простая) — опенсорсная и бесплатная.
Grok 4 — работает в платном тарифе, но есть бесплатные генерации с ограничениями каждый день.
Qwen — открытая и бесплатная модель.
Nano Banana (тестовое название) / Gemini Native Image — на данный момент бесплатная, но нужен VPN (американский или канадский).
Эти нейросети понимают картинку и команды пользователя (обычно в текстовом виде) и могут вносить изменения: менять детали, стиль, цвет, убирать или добавлять объекты, объединять изображения. Их задача — сделать редактирование максимально простым: вместо ручной работы в Photoshop достаточно описать словами, что нужно изменить, и модель сама подстроит картинку под запрос, сохраняя её реалистичной и цельной.🔥 🔥 🔥
Говоря про эти инструменты, возможно, не все понимают весь спектр их возможностей. Да, у каждого из них есть свои проблемы и ограничения. Но, во-первых, почти все они сейчас представлены в первых версиях (кроме ChatGPT), а во-вторых, при правильном использовании и понимании сильных и слабых сторон конкретного инструмента многие проблемы можно обходить.
От появления первых функций редактирования в ChatGPT до того, что сейчас вытворяет Nano Banana, прошло всего полгода — а прогресс огромный. А что будет еще через пол года?🥸
Будущее приходит не за один щелчок, а постепенно. И вот мы уже в точке, где старые инструменты всё больше отходят на второй план, оставаясь в основном для доработки полученных генераций.
Я думаю, по прикреплённым к посту изображениям видно, на что способны эти модели. Но это лишь небольшая часть — многое ещё предстоит переосмыслить в стандартных подходах к работе.
Напишите, может уже использовали что-то и у вас есть какие то интересные нетривиальные решения задач.🧐
Всем крутой недели! Погнали!💪
P.S. Скорее всего чуть меньше буду писать пару недель. В ближайшее время будет очень много работы. Постараюсь поддерживать контентом. Не теряйтесь!
P.P.S. Я как-то писал, что есть посты, которые пока лежат «в столе». По первым тестам Nano Banana удалось решить одну проблему — не до конца, но уже заметен хороший рабочий процесс, который можно использовать. Готовьтесь: это может немного сбить привычное восприятие, основанное на старых подходах. Постараюсь на неделе показать.
@VAI_ART
#VAI_General
Так, давайте пройдемся по ИИ для редактирования изображений. Думаю, нужно подсобрать всё. Сейчас у нас есть очень неплохой набор инструментов, которые могут помочь в реализации широкого спектра задач — как для работы, так и для личных целей.
Что именно у нас есть из инструментов сейчас:
GPTChat — работает в платном тарифе, но есть бесплатные генерации с ограничениями каждый день.
Flux.Kontext — на данный момент представлена в 3 моделях: две доступны через агрегаторы и являются платными, одна (самая простая) — опенсорсная и бесплатная.
Grok 4 — работает в платном тарифе, но есть бесплатные генерации с ограничениями каждый день.
Qwen — открытая и бесплатная модель.
Nano Banana (тестовое название) / Gemini Native Image — на данный момент бесплатная, но нужен VPN (американский или канадский).
Эти нейросети понимают картинку и команды пользователя (обычно в текстовом виде) и могут вносить изменения: менять детали, стиль, цвет, убирать или добавлять объекты, объединять изображения. Их задача — сделать редактирование максимально простым: вместо ручной работы в Photoshop достаточно описать словами, что нужно изменить, и модель сама подстроит картинку под запрос, сохраняя её реалистичной и цельной.
Говоря про эти инструменты, возможно, не все понимают весь спектр их возможностей. Да, у каждого из них есть свои проблемы и ограничения. Но, во-первых, почти все они сейчас представлены в первых версиях (кроме ChatGPT), а во-вторых, при правильном использовании и понимании сильных и слабых сторон конкретного инструмента многие проблемы можно обходить.
От появления первых функций редактирования в ChatGPT до того, что сейчас вытворяет Nano Banana, прошло всего полгода — а прогресс огромный. А что будет еще через пол года?
Будущее приходит не за один щелчок, а постепенно. И вот мы уже в точке, где старые инструменты всё больше отходят на второй план, оставаясь в основном для доработки полученных генераций.
Я думаю, по прикреплённым к посту изображениям видно, на что способны эти модели. Но это лишь небольшая часть — многое ещё предстоит переосмыслить в стандартных подходах к работе.
Напишите, может уже использовали что-то и у вас есть какие то интересные нетривиальные решения задач.
Всем крутой недели! Погнали!
P.S. Скорее всего чуть меньше буду писать пару недель. В ближайшее время будет очень много работы. Постараюсь поддерживать контентом. Не теряйтесь!
P.P.S. Я как-то писал, что есть посты, которые пока лежат «в столе». По первым тестам Nano Banana удалось решить одну проблему — не до конца, но уже заметен хороший рабочий процесс, который можно использовать. Готовьтесь: это может немного сбить привычное восприятие, основанное на старых подходах. Постараюсь на неделе показать.
@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤2🤩1
Forwarded from Малоизвестное интересное
Получено подтверждение — мы в зоне ИИ-сингулярности
Только что вышел шокирующий отчет, переворачивающий наше понимание скорости развития ИИ
Вспомните мир до ChatGPT. Кажется, это было целую вечность назад. Именно тогда, летом 2022 года, лучшие умы планеты — «суперпрогнозисты» и ведущие отраслевые эксперты — собрались на турнир, чтобы предсказать будущее на ближайшие 2-3 года. Они делали ставки на прогнозы экзистенциальных рисков для человечества. И уже тогда было очевидно, что один из таких рисков – бурный прогресс в области ИИ.
И вот сегодня вышел новый отчет, анализирующий точность тех прогнозов (Assessing Near-Term Accuracy in the Existential Risk Persuasion Tournament).
Масштаб недооценки поражает
Математические способности (MATH Dataset):
• ИИ достиг 87,8% в апреле 2024
• Эксперты давали вероятности этого всего 21%
• Суперпрогнозисты — 9%
Общие знания (MMLU):
• ИИ набрал 88,7% к середине 2024
• Эксперты оценивали это в 25%
• Суперпрогнозисты - давали 7%
Математическая олимпиада:
• ИИ получил золото в июле 2025
• Эксперты думали это случится после 2030
• Суперпрогнозисты — после 2035
• Вероятность, что это случится в 2025, была, по их мнению - 8,6% и 2,3%
Вычислительная мощность:
• Суперпрогнозисты недооценили в 5 РАЗ
Что это означает
Турнир закончился ДО выхода ChatGPT в ноябре 2022. Именно тогда началось безумие.
Мы вошли в фазу технологической сингулярности: скорость прогресса стала настолько высокой, что любые прогнозы теряют смысл из-за систематических недооценок.
Малоприятный вывод
Если лучшие эксперты мира недооценивают скорость развития ИИ в 5-10 раз, то:
Тогда вопрос на на много триллионов $
Ведь если даже лучшие эксперты не могут предсказать прогресс на 2 года вперёд, может быть, пора признать, что никто больше не контролирует скорость происходящего?
Наше авто как будто несется на немыслимой скорости в густом тумане, и педаль акселератора вжата в пол. А этот отчет — первое реальное доказательство того, что все мы внутри этого авто.
#Сингулярность #Техносингулярность
Только что вышел шокирующий отчет, переворачивающий наше понимание скорости развития ИИ
Вспомните мир до ChatGPT. Кажется, это было целую вечность назад. Именно тогда, летом 2022 года, лучшие умы планеты — «суперпрогнозисты» и ведущие отраслевые эксперты — собрались на турнир, чтобы предсказать будущее на ближайшие 2-3 года. Они делали ставки на прогнозы экзистенциальных рисков для человечества. И уже тогда было очевидно, что один из таких рисков – бурный прогресс в области ИИ.
И вот сегодня вышел новый отчет, анализирующий точность тех прогнозов (Assessing Near-Term Accuracy in the Existential Risk Persuasion Tournament).
И стало ясно, - все прогнозы провалились. Катастрофически.
Масштаб недооценки поражает
Математические способности (MATH Dataset):
• ИИ достиг 87,8% в апреле 2024
• Эксперты давали вероятности этого всего 21%
• Суперпрогнозисты — 9%
Общие знания (MMLU):
• ИИ набрал 88,7% к середине 2024
• Эксперты оценивали это в 25%
• Суперпрогнозисты - давали 7%
Математическая олимпиада:
• ИИ получил золото в июле 2025
• Эксперты думали это случится после 2030
• Суперпрогнозисты — после 2035
• Вероятность, что это случится в 2025, была, по их мнению - 8,6% и 2,3%
Вычислительная мощность:
• Суперпрогнозисты недооценили в 5 РАЗ
Что это означает
Турнир закончился ДО выхода ChatGPT в ноябре 2022. Именно тогда началось безумие.
Мы вошли в фазу технологической сингулярности: скорость прогресса стала настолько высокой, что любые прогнозы теряют смысл из-за систематических недооценок.
Малоприятный вывод
Если лучшие эксперты мира недооценивают скорость развития ИИ в 5-10 раз, то:
текущие прогнозы достижения человеческого уровня к 2030 году (типа «мягкой сингулярности Сэма Альтмана»), могут осуществиться уже в 2026
Тогда вопрос на на много триллионов $
Готовы ли мы к тому, что ИИ человеческого уровня появится не через 5 лет, а через год?
Ведь если даже лучшие эксперты не могут предсказать прогресс на 2 года вперёд, может быть, пора признать, что никто больше не контролирует скорость происходящего?
Наше авто как будто несется на немыслимой скорости в густом тумане, и педаль акселератора вжата в пол. А этот отчет — первое реальное доказательство того, что все мы внутри этого авто.
#Сингулярность #Техносингулярность
❤9👍3💯1
Forwarded from ИИгорь
Media is too big
VIEW IN TELEGRAM
Видос про установку и тест 2х плагинов с нейронками для фотошопа, а именно Nano-Banana И ComfyUi. Записан экспромтом в моем обычном стиле, поэтому лучше смотреть на 1.5 скорости.
Установка Nano-Banana на 6:30.
Начало про Comfy на 14:50.
🍌 Скрипт для Nano-Banana и Flux Context: Гамроуд
🎷 Плагин c Comfy UI: Гитхаб
Тут надо скачать Required Files, сам плагин отсюда качать на надо, т.к. он старый, кривой и больше не пашет.
🐪 Вот тут починенный мной плагин: Гугол диск
Там 2 папки и файл json.
Папку comfyui-photoshop кладем в
\ComfyUI\custom_nodes
Папку Ai-Comfy кладем в
c:\Program Files\Adobe\Adobe Photoshop 2025\Plug-ins
Воркфлоу кладем либо сюда, либо перетаскиваем в комфи и сохраняем.
\ComfyUI\user\default\workflows\PHOTOSHOP.json
Ну и, конечно, надо будет обновить сам комфи до последней версии и установить недостающие ноды через менеджер.
Установка Nano-Banana на 6:30.
Начало про Comfy на 14:50.
🍌 Скрипт для Nano-Banana и Flux Context: Гамроуд
🎷 Плагин c Comfy UI: Гитхаб
Тут надо скачать Required Files, сам плагин отсюда качать на надо, т.к. он старый, кривой и больше не пашет.
🐪 Вот тут починенный мной плагин: Гугол диск
Там 2 папки и файл json.
Папку comfyui-photoshop кладем в
\ComfyUI\custom_nodes
Папку Ai-Comfy кладем в
c:\Program Files\Adobe\Adobe Photoshop 2025\Plug-ins
Воркфлоу кладем либо сюда, либо перетаскиваем в комфи и сохраняем.
\ComfyUI\user\default\workflows\PHOTOSHOP.json
Ну и, конечно, надо будет обновить сам комфи до последней версии и установить недостающие ноды через менеджер.
🔥8❤5😱2⚡1
Как я писал ранее, с появлением новых инструментов многие вещи приходится переосмысливать — и далеко не всё лежит на поверхности. 🧐
Я уже давно экспериментировал с ИИ в работе с текстурами для 3D-моделей. Напрямую добиться хорошего результата было сложно: приходилось делать массу итераций. Да, даже в таком виде пайплайн ускорял процесс, когда нужно было собрать текстуру из кусков, но всё это казалось муторным и малозначительным.
С выходом Nano Banana я решил проверить: а может ли она править текстуры? И к моему удивлению — получилось! Можно быстро менять фактуру, цвет, добавлять логотипы и прочее. Это действительно ускоряет работу с текстурами в разы.
На примере выше попросил убрать ржавчину и покрасить в синий цвет. Неплохо да?🤓
Проблемы, конечно, есть. На сложных развертках ИИ периодически «тупит» и наносит правки некорректно (но на той же машине развертка не такая и простая и все получилось). Тут выручает такой подход: из двух-трёх генераций собирается нужная текстура.
Кстати, нейросеть отлично понимает графические подсказки: можно стрелкой указать, что перекрасить и во что, или куда поставить логотип — и Nano Banana это делает. Настоящая магия!✨
Также о проблемах. На развертках часто надписи оказываются перевёрнутыми вверх ногами или отзеркаленными. Это пока не понимает ни одна нейросеть. Например, когда просишь заменить название, ИИ его меняет, но при этом автоматически переворачивает и отзеркаливает в правильное положение. В такие моменты я просто подаю ИИ уже перевёрнутое и отзеркаленное изображение, чтобы слово или лого было читаемым, и проблем не возникает. После этого я просто возвращаю изображение в исходное положение.
В целом подход нестандартный, простые задачи Nano Banana закрывает хорошо. С более сложными развертками приходится немного повозиться, но и это заметно ускоряет работу.
Пользуйтесь!🔥
P.S. Не знаю как у вас, а у меня неделя на одном дыхании пролетела. Заранее всем отличных выходных!
@VAI_ART
#VAI_Gallery
Я уже давно экспериментировал с ИИ в работе с текстурами для 3D-моделей. Напрямую добиться хорошего результата было сложно: приходилось делать массу итераций. Да, даже в таком виде пайплайн ускорял процесс, когда нужно было собрать текстуру из кусков, но всё это казалось муторным и малозначительным.
С выходом Nano Banana я решил проверить: а может ли она править текстуры? И к моему удивлению — получилось! Можно быстро менять фактуру, цвет, добавлять логотипы и прочее. Это действительно ускоряет работу с текстурами в разы.
На примере выше попросил убрать ржавчину и покрасить в синий цвет. Неплохо да?
Проблемы, конечно, есть. На сложных развертках ИИ периодически «тупит» и наносит правки некорректно (но на той же машине развертка не такая и простая и все получилось). Тут выручает такой подход: из двух-трёх генераций собирается нужная текстура.
Кстати, нейросеть отлично понимает графические подсказки: можно стрелкой указать, что перекрасить и во что, или куда поставить логотип — и Nano Banana это делает. Настоящая магия!
Также о проблемах. На развертках часто надписи оказываются перевёрнутыми вверх ногами или отзеркаленными. Это пока не понимает ни одна нейросеть. Например, когда просишь заменить название, ИИ его меняет, но при этом автоматически переворачивает и отзеркаливает в правильное положение. В такие моменты я просто подаю ИИ уже перевёрнутое и отзеркаленное изображение, чтобы слово или лого было читаемым, и проблем не возникает. После этого я просто возвращаю изображение в исходное положение.
В целом подход нестандартный, простые задачи Nano Banana закрывает хорошо. С более сложными развертками приходится немного повозиться, но и это заметно ускоряет работу.
Пользуйтесь!
P.S. Не знаю как у вас, а у меня неделя на одном дыхании пролетела. Заранее всем отличных выходных!
@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤33👍18🔥12⚡1🤩1
Конец недели — а значит, подводим итоги того, что вышло интересного. На самом деле в мире ИИ произошло не так много, но зафиксировать это всё же стоит.
🔹OmniHuman-1.5. Это новая модель для создания анимированных цифровых персонажей. Она может оживлять героя по фото, голосу или тексту: синхронизирует губы, подбирает жесты и мимику, делает движения плавными и осмысленными. В отличие от прошлых решений, OmniHuman-1.5 понимает контекст речи и эмоции, поэтому персонаж реагирует естественно: может петь, жестикулировать или взаимодействовать с другими героями в кадре, оставаясь при этом похожим на оригинал на протяжении всего видео.
🔹PixVerse V5. Это новая версия для создания видео из текста или картинок, которая делает видео более кинематографичными: движения стали плавнее и естественнее, картинка — чётче и реалистичнее, а цвета и стиль — стабильнее между кадрами. Он также хорошо понимает ваши инструкции, быстро генерирует ролики и теперь помогает легко создавать короткие истории, мемы или рекламу — не только для профессионалов, но и обычных пользователей
🔹Higgsfield добавили инструмент UGC Factory. Это новый инструмент от Higgsfield для автоматизированного создания стилизованного пользовательского видеоконтента. Он позволяет по простому шаблону выбрать сцену, загрузить изображение продукта или персонажа, а затем с помощью модели Nano Banana автоматически создать видеокадры с разными углами, композицией и вариациями. В результате вы получаете сразу серию keyframes для UGC-рекламы, с сохранённой целостностью логотипов и форм, синхронизированным голосом, движением и фоном. Особенно удобно для промороликов, обзоров и рекламных вставок без полноценной съёмки
🔹 Tencent представила HunyuanWorld-Voyager. Отголоски прошлой недели. Писал об это ранее. Так как увидел на сайте возможность генерации и прогулки по мирам. Но видимо официальный релиз случился только на этой неделе. Это ИИ, который из одной фотографии делает короткое видео с иллюзией 3D-движения камеры. Он одновременно генерирует картинку и карту глубины, а затем накапливает «мировой кэш» из точек, чтобы новые кадры выглядели согласованными при смене угла обзора. Настоящего 3D-мира внутри нет — это скорее умное подстраивание картинок, которое позволяет «ездить по фото» и создавать ощущение объемной сцены, хотя на деле это последовательность кадров, поддерживаемая точечными облаками. Закинул в комментарии презентацию.
🔹В Midjourney появилась новая вкладка Styles — это библиотека визуальных стилей, которые можно просматривать и применять к изображениям. Во вкладке доступны популярные и случайные стили с примерами, каждый из них подключается к промпту через параметр --sref. Понравившиеся варианты можно сохранять для дальнейшего использования, что упрощает поиск нужного визуального настроения и ускоряет работу с генерацией.
🔹Qwen3-Max-Preview. Это новая, мощная языковая модель от Alibaba с потрясающими характеристиками: у неё более 1 триллиона параметров, и она легко справляется с очень длинным контекстом (до ~262 000 токенов). Модель невероятно быстро отвечает, отлично подходит для сложных логических задач, программирования и работы сразу на английском и китайском языках. К сожалению, она закрыта (не опенсорс), и работает через платные API, но по качеству и скорости сравнима с лучшими коммерческими моделями вроде Claude и GPT. Можно попробовать тут и тут.
🔹 ElevenLabs. Вышел SFX v2: новая версия модели для генерации звуковых эффектов. Обновленная версия генератора звуковых эффектов. Теперь система создаёт звук студийного качества, намного лучше понимает текстовые описания и может генерировать эффекты, которые плавно зацикливаются без слышимых переходов. Улучшены алгоритмы, поэтому стало меньше артефактов, звук звучит естественнее и детальнее, а у пользователя появилось больше контроля над результатом. Это делает SFX v2 удобным инструментом как для профессионального саунд-дизайна, так и для быстрых креативных задач
P.S. Если думали, что я не заметил, то я заметил. Очень рад видеть вас всех тут. Завтра познакомимся😉 .
@VAI_ART
#VAI_News
🔹OmniHuman-1.5. Это новая модель для создания анимированных цифровых персонажей. Она может оживлять героя по фото, голосу или тексту: синхронизирует губы, подбирает жесты и мимику, делает движения плавными и осмысленными. В отличие от прошлых решений, OmniHuman-1.5 понимает контекст речи и эмоции, поэтому персонаж реагирует естественно: может петь, жестикулировать или взаимодействовать с другими героями в кадре, оставаясь при этом похожим на оригинал на протяжении всего видео.
🔹PixVerse V5. Это новая версия для создания видео из текста или картинок, которая делает видео более кинематографичными: движения стали плавнее и естественнее, картинка — чётче и реалистичнее, а цвета и стиль — стабильнее между кадрами. Он также хорошо понимает ваши инструкции, быстро генерирует ролики и теперь помогает легко создавать короткие истории, мемы или рекламу — не только для профессионалов, но и обычных пользователей
🔹Higgsfield добавили инструмент UGC Factory. Это новый инструмент от Higgsfield для автоматизированного создания стилизованного пользовательского видеоконтента. Он позволяет по простому шаблону выбрать сцену, загрузить изображение продукта или персонажа, а затем с помощью модели Nano Banana автоматически создать видеокадры с разными углами, композицией и вариациями. В результате вы получаете сразу серию keyframes для UGC-рекламы, с сохранённой целостностью логотипов и форм, синхронизированным голосом, движением и фоном. Особенно удобно для промороликов, обзоров и рекламных вставок без полноценной съёмки
🔹 Tencent представила HunyuanWorld-Voyager. Отголоски прошлой недели. Писал об это ранее. Так как увидел на сайте возможность генерации и прогулки по мирам. Но видимо официальный релиз случился только на этой неделе. Это ИИ, который из одной фотографии делает короткое видео с иллюзией 3D-движения камеры. Он одновременно генерирует картинку и карту глубины, а затем накапливает «мировой кэш» из точек, чтобы новые кадры выглядели согласованными при смене угла обзора. Настоящего 3D-мира внутри нет — это скорее умное подстраивание картинок, которое позволяет «ездить по фото» и создавать ощущение объемной сцены, хотя на деле это последовательность кадров, поддерживаемая точечными облаками. Закинул в комментарии презентацию.
🔹В Midjourney появилась новая вкладка Styles — это библиотека визуальных стилей, которые можно просматривать и применять к изображениям. Во вкладке доступны популярные и случайные стили с примерами, каждый из них подключается к промпту через параметр --sref. Понравившиеся варианты можно сохранять для дальнейшего использования, что упрощает поиск нужного визуального настроения и ускоряет работу с генерацией.
🔹Qwen3-Max-Preview. Это новая, мощная языковая модель от Alibaba с потрясающими характеристиками: у неё более 1 триллиона параметров, и она легко справляется с очень длинным контекстом (до ~262 000 токенов). Модель невероятно быстро отвечает, отлично подходит для сложных логических задач, программирования и работы сразу на английском и китайском языках. К сожалению, она закрыта (не опенсорс), и работает через платные API, но по качеству и скорости сравнима с лучшими коммерческими моделями вроде Claude и GPT. Можно попробовать тут и тут.
🔹 ElevenLabs. Вышел SFX v2: новая версия модели для генерации звуковых эффектов. Обновленная версия генератора звуковых эффектов. Теперь система создаёт звук студийного качества, намного лучше понимает текстовые описания и может генерировать эффекты, которые плавно зацикливаются без слышимых переходов. Улучшены алгоритмы, поэтому стало меньше артефактов, звук звучит естественнее и детальнее, а у пользователя появилось больше контроля над результатом. Это делает SFX v2 удобным инструментом как для профессионального саунд-дизайна, так и для быстрых креативных задач
P.S. Если думали, что я не заметил, то я заметил. Очень рад видеть вас всех тут. Завтра познакомимся
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍15❤8
Всем привет! Давайте еще раз понакомимся.
Я рад видеть тут столько новых и крутых людей! Думаю, чтобы было понятнее, что тут происходит, стоит немного написать о себе и о том, что я делаю.
Зовут меня Алексей, и я занимаюсь компьютерной графикой сколько себя помню. На днях исполнилось 15 лет с того момента, как я устроился на свою первую работу. Срок вроде бы большой, а по ощущениям всё ещё нахожусь где-то у подножья этой горы. Я много лет работал сначала над браузерными, а потом над мобильными играми. За плечами есть и несколько крупных проектов на ПК. Сейчас я ушел в сферу VR. Мы делаем шутер со свободным перемещением.
За эти годы я прошел путь от моделлера до арт-директора. Путь был долгий и извилистый, но я тут.
И за всё это время огонь внутри не погас. Я всё так же горю желанием двигаться вперёд и развиваться. Поэтому тяга узнавать новое так и осталась со мной. Появление ИИ стало для меня настоящим глотком свежего воздуха, как будто выпил энергетик🔥 . Поэтому впился и очень много свободного времени посвящаю изучению этой темы.
Эта группа появилась как способ структурировать знания и вместе с тем обмениваться опытом и навыками. Хочется создать сообщество, где соберутся такие же увлеченные и горящие люди, с которыми будем вместе двигаться вперед!
Спасибо за доверие. Не подведу!❤️
P.S. Я вижу, что вы пишете, но пока не успеваю ответить. Сейчас у меня аврал, нужно многое сделать и сдать. Но как только смогу, то обязательно всё прочитаю и отвечу.
Я рад видеть тут столько новых и крутых людей! Думаю, чтобы было понятнее, что тут происходит, стоит немного написать о себе и о том, что я делаю.
Зовут меня Алексей, и я занимаюсь компьютерной графикой сколько себя помню. На днях исполнилось 15 лет с того момента, как я устроился на свою первую работу. Срок вроде бы большой, а по ощущениям всё ещё нахожусь где-то у подножья этой горы. Я много лет работал сначала над браузерными, а потом над мобильными играми. За плечами есть и несколько крупных проектов на ПК. Сейчас я ушел в сферу VR. Мы делаем шутер со свободным перемещением.
За эти годы я прошел путь от моделлера до арт-директора. Путь был долгий и извилистый, но я тут.
И за всё это время огонь внутри не погас. Я всё так же горю желанием двигаться вперёд и развиваться. Поэтому тяга узнавать новое так и осталась со мной. Появление ИИ стало для меня настоящим глотком свежего воздуха, как будто выпил энергетик
Эта группа появилась как способ структурировать знания и вместе с тем обмениваться опытом и навыками. Хочется создать сообщество, где соберутся такие же увлеченные и горящие люди, с которыми будем вместе двигаться вперед!
Спасибо за доверие. Не подведу!
P.S. Я вижу, что вы пишете, но пока не успеваю ответить. Сейчас у меня аврал, нужно многое сделать и сдать. Но как только смогу, то обязательно всё прочитаю и отвечу.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29❤11👍4🤩1
Один из топовых 3D-генераторов Hitem3D обновился до новой версии. Обещают более высокое качество, а также добавили генерацию текстур. На бесплатном тарифе дают 100 кредитов, при этом одна генерация в новой версии стоит 40. Также 10 еще возьмет за генерацию текстуры. Развертка все еще оставляет желать лучшего. Как обычно - чем больше аккаунтов, тем больше возможностей. 🙂
Первые тесты показали, что результат действительно выглядит хорошо. Прибавилась детализация и формы стал контролировать намного лучше.
Ранее я уже сравнивал качество генерации тут. Можете сравнить старого и нового Логана. Я думаю разница сразу видна.
Хуже простраивает заднюю часть, даже по соотношению с предыдущей версией, но думаю поправят.
Судя по всему Hitem3D, на данный момент становится лучшим генератором моделей. Но нужно еще поковырять его.
Нужны более подробные тесты?
@VAI_ART
#VAI_News
Первые тесты показали, что результат действительно выглядит хорошо. Прибавилась детализация и формы стал контролировать намного лучше.
Ранее я уже сравнивал качество генерации тут. Можете сравнить старого и нового Логана. Я думаю разница сразу видна.
Хуже простраивает заднюю часть, даже по соотношению с предыдущей версией, но думаю поправят.
Судя по всему Hitem3D, на данный момент становится лучшим генератором моделей. Но нужно еще поковырять его.
Нужны более подробные тесты?
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9💯5❤2🔥1
Пока я в запарах по проекту и пишу новые посты, давайте обсудим одну интересную тему. А именно - получится ли у ИИ заменить людей в процессе создания, на примере творчества? 🧐
Лично моё мнение: ИИ помогут убрать рутину в среднесрочной перспективе. Но даже это произойдёт не так скоро, чтобы полностью закрыть все рутинные задачи. А вот творчество они не заменят. Пока ИИ умеют только копировать - и делают это всё лучше, но всё же это остаётся копированием. Придумать что-то новое они пока не способны, и даже в будущем это будет для них сложной задачей.
Я также думаю, что не стоит бояться массового сокращения рабочих мест. Скорее всего привычные нам сейчас специальности трансформируются во что-то новое. Да, в любом трансформационном процессе кто-то пострадает, но чтобы не оказаться в этой группе, важно оставаться гибким и изучать новые направления и инструменты. Тогда шансы остаться востребованными вырастут в разы.
И нужно помнить: за всю историю человечества это далеко не первая техническая революция.
Уже жду момента, когда появятся темы вроде полностью хендмейд модель или рисунок, поэтому он стоит дороже. Представьте времена, когда разработчик будет гордиться тем, что игра создана полностью людьми, без применения ИИ и других технологий. Экологичная хендмейд-игра с зелёной наклейкой, звучит интересно. Думаю, такая ниша тоже найдёт своё место.😎
Интересно ваше мнение. Что думаете по этому поводу?
@VAI_ART
#VAI_Notes
Лично моё мнение: ИИ помогут убрать рутину в среднесрочной перспективе. Но даже это произойдёт не так скоро, чтобы полностью закрыть все рутинные задачи. А вот творчество они не заменят. Пока ИИ умеют только копировать - и делают это всё лучше, но всё же это остаётся копированием. Придумать что-то новое они пока не способны, и даже в будущем это будет для них сложной задачей.
Я также думаю, что не стоит бояться массового сокращения рабочих мест. Скорее всего привычные нам сейчас специальности трансформируются во что-то новое. Да, в любом трансформационном процессе кто-то пострадает, но чтобы не оказаться в этой группе, важно оставаться гибким и изучать новые направления и инструменты. Тогда шансы остаться востребованными вырастут в разы.
И нужно помнить: за всю историю человечества это далеко не первая техническая революция.
Уже жду момента, когда появятся темы вроде полностью хендмейд модель или рисунок, поэтому он стоит дороже. Представьте времена, когда разработчик будет гордиться тем, что игра создана полностью людьми, без применения ИИ и других технологий. Экологичная хендмейд-игра с зелёной наклейкой, звучит интересно. Думаю, такая ниша тоже найдёт своё место.
Интересно ваше мнение. Что думаете по этому поводу?
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3👎2🤝2
Конец недели, а это значит у нас постоянная рубрика — новости недели. Пробежимся быстро по основным релизам.
🔹 Думаю, одной из главных новостей недели обновленная версия Seedream 4.0. Позволяет редактировать и генерировать изображения. По редактированию многие ставят как конкурента недавней Nanobanana. Как по мне неплохая сеть, но все же банана будет получше.
Создаёт картинки в 2K меньше чем за 2 секунды, поддерживает до 6 референсов для сохранения стиля или персонажей, умеет масштабировать до 4K, а также по простым текстовым командам можно менять фон, свет, стиль или убирать лишние объекты. Не бесплатная, уже доступна на всех агрегаторах по-типу Krea и тд. Презентация в комментариях.
🔹 Kling AI Avatar инструмент, который позволяет из одной фотографии и записи голоса сделать говорящего, эмоционального аватара: он синхронизирует губы, мимику, жесты, автоматически подбирает выражения и стиль речи. Поддерживается множество языков, высокое качество видео (HD / 1080p), всё работает быстро — идеален для социальных сетей, объяснительных роликов, маркетинга и даже образований. Презентация в комментариях.
🔹 В ближайшие недели YouTube запускает ИИ-дубляж видео на русский и другие языки. Будет доступно 30 языков.
🔹 EbSynth — это программа для создания визуальных эффектов, позволяющая изменять видео, редактируя один кадр. Не смотрел, но по презентации, которую скинул в комментарии, выглядит очень достойно.
🔹 Gemini теперь позволяет загружать аудиофайлы — подкасты, интервью, записи встреч и автоматически транскрибировать и суммировать их. То есть можно просто перетащить, например, двухчасовой MP3 и попросить выдавать ключевые моменты. Это уже доступно как часть функции Audio Understanding.
🔹 NotebookLM теперь переводит любой документ в подкаст или презентацию, а с обновлением добавили новые режимы генерации: можно выбрать краткий пересказ (Brief), подробный разбор (Deep Dive), критику текста (Critique) или даже сгенерированный «дебат» с аргументами за и против (Debate). Появились также Quiz и Flashcards — тесты и карточки для закрепления материала. И главное—видеопрезентации с озвучкой теперь работают на русском и ещё 80 языках.
🔹 Hitem3d обновился до новой версии. Писал тут про него. Тесты сделаю. Думаю, завтра все выложу.
🔹Qwen-3-ASR — новая модель для распознавания речи с очень высокими показателями точности. Она умеет автоматически определять язык и поддерживает английский, китайский, русский и ещё девять языков. Важная особенность — возможность подключить кастомный словарь: можно загрузить список имён, терминов или даже выдуманных слов, и модель начнёт корректно их распознавать без дополнительного обучения. В релизе особенно подчёркивается универсальность: система одинаково хорошо справляется и с обычной речью, и с нестандартными аудиозаписями. Единственный минус — веса пока не выложили, модель доступна только через API. Если же их опубликуют, это может стать отличным опенсорс решением для проектов по преобразованию речи в текст. Попробовать можно тут.
🔹Claude теперь умеет не только читать, но и создавать и редактировать файлы: PDF, таблицы, презентации и документы. Можно загрузить данные или текст, а Claude сам превратит их в готовый отчёт, таблицу с формулами или презентацию с графиками, а также конвертировать форматы. Всё это работает прямо в чате, доступно пока в планах Max, Team и Enterprise и позволяет быстро анализировать данные, строить визуализации и выпускать финальные материалы без перехода в сторонние редакторы
🔹Ну и ещё одна интересная новость от Apple: в новые AirPods добавили функцию синхронного перевода. Пока непонятно, насколько хорошо она работает, но сама идея звучит круто. Похоже, скоро языки можно будет и не учить—всё будет автоматически переводиться на нужный, а языковые барьеры начнут стремительно исчезать.
На этой неделе появились новые видео генераторы, и генераторы изображений. Но, думаю, об этом уже нет смысла подробно писать—рабочих решений и так очень много. Поэтому дальше буду рассказывать только о тех новинках, которые действительно чем-то выделяются.
@VAI_ART
#VAI_News
🔹 Думаю, одной из главных новостей недели обновленная версия Seedream 4.0. Позволяет редактировать и генерировать изображения. По редактированию многие ставят как конкурента недавней Nanobanana. Как по мне неплохая сеть, но все же банана будет получше.
Создаёт картинки в 2K меньше чем за 2 секунды, поддерживает до 6 референсов для сохранения стиля или персонажей, умеет масштабировать до 4K, а также по простым текстовым командам можно менять фон, свет, стиль или убирать лишние объекты. Не бесплатная, уже доступна на всех агрегаторах по-типу Krea и тд. Презентация в комментариях.
🔹 Kling AI Avatar инструмент, который позволяет из одной фотографии и записи голоса сделать говорящего, эмоционального аватара: он синхронизирует губы, мимику, жесты, автоматически подбирает выражения и стиль речи. Поддерживается множество языков, высокое качество видео (HD / 1080p), всё работает быстро — идеален для социальных сетей, объяснительных роликов, маркетинга и даже образований. Презентация в комментариях.
🔹 В ближайшие недели YouTube запускает ИИ-дубляж видео на русский и другие языки. Будет доступно 30 языков.
🔹 EbSynth — это программа для создания визуальных эффектов, позволяющая изменять видео, редактируя один кадр. Не смотрел, но по презентации, которую скинул в комментарии, выглядит очень достойно.
🔹 Gemini теперь позволяет загружать аудиофайлы — подкасты, интервью, записи встреч и автоматически транскрибировать и суммировать их. То есть можно просто перетащить, например, двухчасовой MP3 и попросить выдавать ключевые моменты. Это уже доступно как часть функции Audio Understanding.
🔹 NotebookLM теперь переводит любой документ в подкаст или презентацию, а с обновлением добавили новые режимы генерации: можно выбрать краткий пересказ (Brief), подробный разбор (Deep Dive), критику текста (Critique) или даже сгенерированный «дебат» с аргументами за и против (Debate). Появились также Quiz и Flashcards — тесты и карточки для закрепления материала. И главное—видеопрезентации с озвучкой теперь работают на русском и ещё 80 языках.
🔹 Hitem3d обновился до новой версии. Писал тут про него. Тесты сделаю. Думаю, завтра все выложу.
🔹Qwen-3-ASR — новая модель для распознавания речи с очень высокими показателями точности. Она умеет автоматически определять язык и поддерживает английский, китайский, русский и ещё девять языков. Важная особенность — возможность подключить кастомный словарь: можно загрузить список имён, терминов или даже выдуманных слов, и модель начнёт корректно их распознавать без дополнительного обучения. В релизе особенно подчёркивается универсальность: система одинаково хорошо справляется и с обычной речью, и с нестандартными аудиозаписями. Единственный минус — веса пока не выложили, модель доступна только через API. Если же их опубликуют, это может стать отличным опенсорс решением для проектов по преобразованию речи в текст. Попробовать можно тут.
🔹Claude теперь умеет не только читать, но и создавать и редактировать файлы: PDF, таблицы, презентации и документы. Можно загрузить данные или текст, а Claude сам превратит их в готовый отчёт, таблицу с формулами или презентацию с графиками, а также конвертировать форматы. Всё это работает прямо в чате, доступно пока в планах Max, Team и Enterprise и позволяет быстро анализировать данные, строить визуализации и выпускать финальные материалы без перехода в сторонние редакторы
🔹Ну и ещё одна интересная новость от Apple: в новые AirPods добавили функцию синхронного перевода. Пока непонятно, насколько хорошо она работает, но сама идея звучит круто. Похоже, скоро языки можно будет и не учить—всё будет автоматически переводиться на нужный, а языковые барьеры начнут стремительно исчезать.
На этой неделе появились новые видео генераторы, и генераторы изображений. Но, думаю, об этом уже нет смысла подробно писать—рабочих решений и так очень много. Поэтому дальше буду рассказывать только о тех новинках, которые действительно чем-то выделяются.
@VAI_ART
#VAI_News
1👍10❤5🔥1
Сделал быстрые тесты нового Hitem3D v1.5. Что можно сказать: по сравнению с предыдущей версией, как уже писал, он действительно стал лучше держать форму, добавили детализации и, самое главное, появились текстуры.
Из минусов - иногда детализация оказывается излишней и превращается в шум. На портретах форму лучше держит Sparc3D, а пальма выглядит аккуратнее в Hunuan3D - именно из-за того, что в Hitem3D детализация начинает портить меш и работает не в его пользу.
В целом это хорошее обновление, инструмент можно использовать для работы.
Интересно, что ситуация похожа на 2D-генераторы: под каждую задачу приходится выбирать отдельный ИИ - один лучше в одном, другой в другом.
Сейчас собираю прототип локации, и постоянно приходится переключаться между сервисами. Хочется уже чего-то универсального, а не десятки инструментов, которыми приходится жонглировать. Кстати, часть объектов сделал вообще в Tripo3D - неожиданно, но на определенных задачах версия 2.5 (последняя 3-я версия) показала себя лучше остальных ИИ.
@VAI_ART
#VAI_Practice
Из минусов - иногда детализация оказывается излишней и превращается в шум. На портретах форму лучше держит Sparc3D, а пальма выглядит аккуратнее в Hunuan3D - именно из-за того, что в Hitem3D детализация начинает портить меш и работает не в его пользу.
В целом это хорошее обновление, инструмент можно использовать для работы.
Интересно, что ситуация похожа на 2D-генераторы: под каждую задачу приходится выбирать отдельный ИИ - один лучше в одном, другой в другом.
Сейчас собираю прототип локации, и постоянно приходится переключаться между сервисами. Хочется уже чего-то универсального, а не десятки инструментов, которыми приходится жонглировать. Кстати, часть объектов сделал вообще в Tripo3D - неожиданно, но на определенных задачах версия 2.5 (последняя 3-я версия) показала себя лучше остальных ИИ.
@VAI_ART
#VAI_Practice
👍8❤4🤝2
Media is too big
VIEW IN TELEGRAM
Это я к чему. Banana вышла всего две недели назад, а за это время уже появился третий инструмент с редактированием и неплохим качеством. На прошлой неделе вышел Seedream 4.0 — ИИ от TikTok. А вчера Reve обновилась и теперь тоже заявляет, что умеет редактировать. И, судя по примерам, делает это неплохо. (Если кто забыл, писал о ней вот тут.). Под капотом Claude для лучшего понимания запросов.
В отличие от Seedream 4.0, у Reve есть бесплатные генерации.
Пробуйте!
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3
Media is too big
VIEW IN TELEGRAM
Hunyuan3D 3.0 от Tencent — новая версия генератора 3D-моделей, которая значительно повысила точность геометрии (заявляют рост качества в три раза по сравнению с предыдущими версиями) и теперь доступна через комплексное решение Hunyuan 3D Studio, позволяющее пройти весь путь от концепта до анимации. Инструмент нацелен на то, чтобы удешевить и ускорить классический 3D-пайплайн, предлагая создание более детализированных ассетов и снижение ручной работы.
Когда это все тестировать, чисто риторический вопрос)
Тесты нужны?)
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥2❤1