Нейронутые | ИИ (Егор Апполонов)
13.6K subscribers
1.19K photos
286 videos
1 file
345 links
Я — Егор Апполонов, эксперт по ии-видео. Победитель 3 международных конкурсов ии-фильмов. Связь @egorevna

Портфолио: https://egorappolonov.ru/ и @aigencydigital

Курс по ии-видео: https://aifilm.online/

РКН https://clck.ru/3NNPKh
Download Telegram
Трамп приехал к избирателям. Фото — РИА-Новости.

В комментариях жара
👍33🤣30🔥5🤬1
Вчера я написал, что в Chat GPT появилась новая фича — генерация изображений прямо внутри GPT-4o. В комментариях сразу же меня обвинили в кликбейтных новостях, говоря, что так и раньше было и никакой новости в этом нет.

Нет, так как стало сейчас, раньше даже и близко не было.

И сейчас я подробно объясню, почему вчера Open AI совершила очередную революцию, хоть этого многие и не заметили.

А произошло реально грандиозное обновление — генерацию встроили в мультимодальную модель GPT-4o. Я тестировал модель всю ночь и могу сказать, что я «немножечко в шоке» — настолько все круто. Итак, что же случилось.

Во время беседы: вы просто общаетесь словами, а Chat GPT запоминает все, что уже обсуждалось, и делает новые картинки, которые логично продолжают предыдущие. Например, если вы вместе придумываете героя для игры, он будет выглядеть одинаково во всех версиях, пока вы уточняете детали — цвет глаз, одежду, стиль и т.д.

Точная визуализация: генерация изображений GPT-4o отличается точной визуализацией текста, точным выполнением промтов и использованием встроенной базы знаний 4o и контекста чата, включая преобразование загруженных изображений или использование их в качестве визуального вдохновения.

GPT‑4o умеет точно следовать вашим описаниям при создании изображений. В то время как другие ИИ путаются, если в сцене больше 5–8 объектов, GPT‑4o спокойно справляется с 10–20 — и правильно расставляет их, учитывая все детали, отношения между ними и их свойства. То есть если вы скажете «красная чашка на синем столе рядом с зеленой книгой», он всё поймет и изобразит именно так.

Эти возможности облегчают создание именно того изображения, которое вы себе представляете, помогая вам более эффективно общаться с помощью визуальных элементов и превращая генерацию изображений в практический инструмент с точностью и мощностью.

Добавилась консистентность персонажей: вы можете воспроизводить героя с высоким уровнем точности.

Фотореалистичность (наконец-то): Dall-e генерила довольно убогие картинки. Благодаря обучению на миллионах разных стилей — от фоток до картин и комиксов — GPT‑4o умеет создавать изображения, которые выглядят правдоподобно и в нужной стилистике. Хотите фотореалистичный портрет? ГПТ сделает так, будто это настоящий снимок. Примеры в следующем посте — и это вау.

Широкий взгляд: создатели обучили модели «совместному восприятию» изображений и текста. Пояснение: модель «видит» не только то, как изображения соотносятся с языком, но и то, как они соотносятся друг с другом. Простыми словами —нейросеть обучили не просто понимать текст и картинки по отдельности, а учиться на связке «текст + изображение одновременно». И даже больше — модель понимает связи между самими изображениями, как они похожи, чем отличаются и что между ними общего. Итог: модель теперь гораздо лучше генерирует картинки, потому что: 1. Понимает, как вещи выглядят. 2. учитывает контекст (если сказано «ночь», делает темно; если «улыбка», рисует улыбку).

Рендеринг текста: картинка стоит тысячи слов, но иногда создание нескольких слов в нужном месте может повысить смысл изображения. Способность 4o сочетать точные символы с изображениями превращает генерацию изображений в инструмент визуальной коммуникации.

Цифровое зрение: GPT‑4o может «считывать» загруженные вами изображения, запоминать их детали и использовать эту информацию, чтобы создавать новые картинки в том же стиле или с учетом увиденного (и даже добавить на те же картинки что-то новое) Например, вы загрузили фото логотипа — и ИИ потом сам добавляет его на футболки, постеры или в дизайн, не спрашивая каждый раз заново.

Ложка дегтя: модель не идеальна. На данный момент есть много ограничений, над устранением которых инженеры, как они сами говорят «будут» работать путем улучшения модели после первоначального запуска.

Мой прогноз — в скором времени Chat GPT переименуют. Сэм Альтман, уверен, уже вовсю думает об этом. Да, я помню, что обещал вам вот в этом посте огромное интервью с ним. Обязательно опубликую. Скоро.

Я никогда не пишу на "Нейронутых" во имя кликбейта. Я проверяю информацию и публикую.
👍36🙈1
Эти изобаражения сделал Chat GPT. Да, вы не ослышались. С убогими генерациями DALL-E покончено. Новость о том, как это стало возможно — в посте выше.
1👍30🔥15
OpenAI выкатывает обновление за обновлением — так что я продолжу постить. Сгенерил картинку Папы со Снуп Доггом… в Sora.

Итак, в Sora появилась опция генерации статичных изображений (скорее всего тот же GPT 4o но данных пока не нашел). Картинки, как вы правильно догадались, можно в последствии анимировать.

Ушел тестировать. Генерить тут.

p.s. Чтобы совсем не спамить — накидаю в комментарии картиночек.

p.p.s Первые впечатления — если правильно задавать промты, то все тип-топ. См. комментарии к этому посту.
1👍21🔥1🤣1
А еще чат GPT 4o теперь умеет менять стиль картинок на любой стиль. Вот вам Миядзаки. Узнали фильм?
2👍51
Ну и еще немного нового GPT 4o
1🤣28🔥19🥰2
Простите, не могу остановиться.
2🔥59🤣16💩6👍5
В Kling полезнейшее обновление — генерация звуков к видео.

Загружаете свое видео или выбираете из библиотеки то, что сгенерили в Клинге, DeepSeek сам предложит промт, который можно отредактировать при желании. Нажимаете Generate и ждете. А потом случается магия.

Пробуем тут.
🔥17👍5
Итак, публикую обещанное громадное интервью с Сэмом Альтманом, которое объясняет вообще все. Как появился Chat GPT, когда наступит AGI и все такое. Читайте — это и правда интересно.

Поставьте пожалуйста лайки этому материалу на ресурсе VC — это важно, чтобы материал правильно отранжировался и его увидело больше людей. Чтобы поставить лайк можно перейти по ссылке:

https://vc.ru/ai/1894430-sem-altman-o-buduschem-agi
🔥28👍10
Делюсь очередным реальным кейсом — прислали лукбук коллекции (только вещи), нужна были модели в присланной одежде. На видео — результат.

Хотите научиться также? Приходите на курс "ИИ-кино 2.0". И вы станете гуру видеогенераций. Курс стартует уже завтра, 30го марта.

Присоединяйтесь, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.

🤘 Программа и регистрация ЗДЕСЬ
🔥26👍7💩5
🎬 Специальный гость курса "ИИ-кино 2.0" — Валерия Гай-Германика. Старт курса уже сегодня, 30 марта в 19-00 мск. Запрыгивайте в последний вагон :-)

К курсу ИИ-КИНО 2.0 присоединяется особая гостья — Валерия Гай-Германика, режиссер, каждый фильм которой вызывает широкий резонанс. Ее уникальный стиль, острые темы и яркие визуальные образы — то, чему невозможно научиться по учебнику. Но теперь у вас есть шанс услышать из первых уст, как создаются по-настоящему захватывающие истории, которые говорят с душой зрителя.

На эксклюзивной встрече Валерия раскроет, как работать с эмоцией, где искать настоящие истории, почему важна правда в кадре — и как ИИ может стать новым инструментом режиссера, не заменяя, а усиливая голос автора.

Присоединяйтесь к курсу, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.

🤘 Программа и регистрация ЗДЕСЬ

Это не все сюрпризы курса. Будут еще как минимум 2 супер гостя.

Курс стартует уже сегодня, 30 марта, в 19-00 по московоскому времени.

Будут записи с бессрочным доступом.

Присоединяйтесь, чтобы создавать ии-видео, которые действительно будут привлекать внимание.
🔥17💩8👍5
Media is too big
VIEW IN TELEGRAM
🎬Держите новый кинчик от "Нейронутых". Фильм "Три поросёнка. Свиное правосудие". Режиссерская версия.

🔫 Страховые схемы, спецназ и нешуточная афера: в этой современной версии классики волк — не злодей, а жертва трех ушлых поросят, которые провернули многоходовочку века.

Переосмыслил сказку "Три поросёнка" — получился острый как лезвие триллер в духе Гая Ричи.

Смотрите, конечно же, со звуком.

Инструменты: Chat GPT, Gemini, Veo2, Kling, ElevenLabs, Topaz Video AI + живая озвучка (писали реальных людей в студии — кроме 2-х, сгенеренных ИИ голосов, угадаете каких?).

Ставьте лайки. Ну или что вы там захотите поставить.
6🔥130💩26👍11🥰5🤬1💯1🙈1
Помните как говорили: когда нейросети научатся рисовать руку с пятью пальцами, они захватят мир? Ну собственно, все.
2🤣58🔥12👍5🙈3🥰1
Media is too big
VIEW IN TELEGRAM
Когда еще не было ни Kling, ни MiniMax, ни Sora и уж тем более Veo2, я много месяцев работал на максимальном тарифе Gen-2 (а потом в Gen-3) как безальтернативном генераторе ии-видео.

Я много раз писал на канале, как плох Gen-3. Отписался 9 месяцев назад и с тех пор не использовал вообще.

После релиза Gen-4, о котором идет речь в этом видео (перевел на русский, все для вас), снова иду оплачивать подписку. Все протестирую и дам развернутое заключение.
🔥43👍24
Media is too big
VIEW IN TELEGRAM
Этот проект я начал еще в декабре. Делал его медленно, время от времени. В какой-то момент хотел все бросить, потому что по пути выяснилось, что все гораздо сложнее, чем казалось на первый взгляд. Собрать редкие архивные фото "Кино". Отреставрировать — фото в хорошем качестве в сети попросту нет. Оживить. Сложить историю... Нужно стальное терпение.

Я не бросил и все же решил доделать это видео. Всегда хотелось посмотреть клип на любимую песню "Печаль" в хорошем качестве.

Так получилось это музыкальное видео, в котором — только документальная фотохроника. Я отреставрировал реальные кадры и оживил. Проект для меня важный. Личный.

Итак. Я рад, что могу сделать эту премьеру на "Нейронутых"
7🔥214👍45🥰18💯2