Вчера я написал, что в Chat GPT появилась новая фича — генерация изображений прямо внутри GPT-4o. В комментариях сразу же меня обвинили в кликбейтных новостях, говоря, что так и раньше было и никакой новости в этом нет.
И сейчас я подробно объясню, почему вчера Open AI совершила очередную революцию, хоть этого многие и не заметили.
А произошло реально грандиозное обновление — генерацию встроили в мультимодальную модель GPT-4o. Я тестировал модель всю ночь и могу сказать, что я «немножечко в шоке» — настолько все круто. Итак, что же случилось.
Во время беседы: вы просто общаетесь словами, а Chat GPT запоминает все, что уже обсуждалось, и делает новые картинки, которые логично продолжают предыдущие. Например, если вы вместе придумываете героя для игры, он будет выглядеть одинаково во всех версиях, пока вы уточняете детали — цвет глаз, одежду, стиль и т.д.
Точная визуализация: генерация изображений GPT-4o отличается точной визуализацией текста, точным выполнением промтов и использованием встроенной базы знаний 4o и контекста чата, включая преобразование загруженных изображений или использование их в качестве визуального вдохновения.
GPT‑4o умеет точно следовать вашим описаниям при создании изображений. В то время как другие ИИ путаются, если в сцене больше 5–8 объектов, GPT‑4o спокойно справляется с 10–20 — и правильно расставляет их, учитывая все детали, отношения между ними и их свойства. То есть если вы скажете «красная чашка на синем столе рядом с зеленой книгой», он всё поймет и изобразит именно так.
Эти возможности облегчают создание именно того изображения, которое вы себе представляете, помогая вам более эффективно общаться с помощью визуальных элементов и превращая генерацию изображений в практический инструмент с точностью и мощностью.
Добавилась консистентность персонажей: вы можете воспроизводить героя с высоким уровнем точности.
Фотореалистичность (наконец-то): Dall-e генерила довольно убогие картинки. Благодаря обучению на миллионах разных стилей — от фоток до картин и комиксов — GPT‑4o умеет создавать изображения, которые выглядят правдоподобно и в нужной стилистике. Хотите фотореалистичный портрет? ГПТ сделает так, будто это настоящий снимок. Примеры в следующем посте — и это вау.
Широкий взгляд: создатели обучили модели «совместному восприятию» изображений и текста. Пояснение: модель «видит» не только то, как изображения соотносятся с языком, но и то, как они соотносятся друг с другом. Простыми словами —нейросеть обучили не просто понимать текст и картинки по отдельности, а учиться на связке «текст + изображение одновременно». И даже больше — модель понимает связи между самими изображениями, как они похожи, чем отличаются и что между ними общего. Итог: модель теперь гораздо лучше генерирует картинки, потому что: 1. Понимает, как вещи выглядят. 2. учитывает контекст (если сказано «ночь», делает темно; если «улыбка», рисует улыбку).
Рендеринг текста: картинка стоит тысячи слов, но иногда создание нескольких слов в нужном месте может повысить смысл изображения. Способность 4o сочетать точные символы с изображениями превращает генерацию изображений в инструмент визуальной коммуникации.
Цифровое зрение: GPT‑4o может «считывать» загруженные вами изображения, запоминать их детали и использовать эту информацию, чтобы создавать новые картинки в том же стиле или с учетом увиденного (и даже добавить на те же картинки что-то новое) Например, вы загрузили фото логотипа — и ИИ потом сам добавляет его на футболки, постеры или в дизайн, не спрашивая каждый раз заново.
Ложка дегтя: модель не идеальна. На данный момент есть много ограничений, над устранением которых инженеры, как они сами говорят «будут» работать путем улучшения модели после первоначального запуска.
Мой прогноз — в скором времени Chat GPT переименуют. Сэм Альтман, уверен, уже вовсю думает об этом. Да, я помню, что обещал вам вот в этом посте огромное интервью с ним. Обязательно опубликую. Скоро.
Я никогда не пишу на "Нейронутых" во имя кликбейта. Я проверяю информацию и публикую.
Нет, так как стало сейчас, раньше даже и близко не было.И сейчас я подробно объясню, почему вчера Open AI совершила очередную революцию, хоть этого многие и не заметили.
А произошло реально грандиозное обновление — генерацию встроили в мультимодальную модель GPT-4o. Я тестировал модель всю ночь и могу сказать, что я «немножечко в шоке» — настолько все круто. Итак, что же случилось.
Во время беседы: вы просто общаетесь словами, а Chat GPT запоминает все, что уже обсуждалось, и делает новые картинки, которые логично продолжают предыдущие. Например, если вы вместе придумываете героя для игры, он будет выглядеть одинаково во всех версиях, пока вы уточняете детали — цвет глаз, одежду, стиль и т.д.
Точная визуализация: генерация изображений GPT-4o отличается точной визуализацией текста, точным выполнением промтов и использованием встроенной базы знаний 4o и контекста чата, включая преобразование загруженных изображений или использование их в качестве визуального вдохновения.
GPT‑4o умеет точно следовать вашим описаниям при создании изображений. В то время как другие ИИ путаются, если в сцене больше 5–8 объектов, GPT‑4o спокойно справляется с 10–20 — и правильно расставляет их, учитывая все детали, отношения между ними и их свойства. То есть если вы скажете «красная чашка на синем столе рядом с зеленой книгой», он всё поймет и изобразит именно так.
Эти возможности облегчают создание именно того изображения, которое вы себе представляете, помогая вам более эффективно общаться с помощью визуальных элементов и превращая генерацию изображений в практический инструмент с точностью и мощностью.
Добавилась консистентность персонажей: вы можете воспроизводить героя с высоким уровнем точности.
Фотореалистичность (наконец-то): Dall-e генерила довольно убогие картинки. Благодаря обучению на миллионах разных стилей — от фоток до картин и комиксов — GPT‑4o умеет создавать изображения, которые выглядят правдоподобно и в нужной стилистике. Хотите фотореалистичный портрет? ГПТ сделает так, будто это настоящий снимок. Примеры в следующем посте — и это вау.
Широкий взгляд: создатели обучили модели «совместному восприятию» изображений и текста. Пояснение: модель «видит» не только то, как изображения соотносятся с языком, но и то, как они соотносятся друг с другом. Простыми словами —нейросеть обучили не просто понимать текст и картинки по отдельности, а учиться на связке «текст + изображение одновременно». И даже больше — модель понимает связи между самими изображениями, как они похожи, чем отличаются и что между ними общего. Итог: модель теперь гораздо лучше генерирует картинки, потому что: 1. Понимает, как вещи выглядят. 2. учитывает контекст (если сказано «ночь», делает темно; если «улыбка», рисует улыбку).
Рендеринг текста: картинка стоит тысячи слов, но иногда создание нескольких слов в нужном месте может повысить смысл изображения. Способность 4o сочетать точные символы с изображениями превращает генерацию изображений в инструмент визуальной коммуникации.
Цифровое зрение: GPT‑4o может «считывать» загруженные вами изображения, запоминать их детали и использовать эту информацию, чтобы создавать новые картинки в том же стиле или с учетом увиденного (и даже добавить на те же картинки что-то новое) Например, вы загрузили фото логотипа — и ИИ потом сам добавляет его на футболки, постеры или в дизайн, не спрашивая каждый раз заново.
Ложка дегтя: модель не идеальна. На данный момент есть много ограничений, над устранением которых инженеры, как они сами говорят «будут» работать путем улучшения модели после первоначального запуска.
Мой прогноз — в скором времени Chat GPT переименуют. Сэм Альтман, уверен, уже вовсю думает об этом. Да, я помню, что обещал вам вот в этом посте огромное интервью с ним. Обязательно опубликую. Скоро.
Я никогда не пишу на "Нейронутых" во имя кликбейта. Я проверяю информацию и публикую.
👍36🙈1
Эти изобаражения сделал Chat GPT. Да, вы не ослышались. С убогими генерациями DALL-E покончено. Новость о том, как это стало возможно — в посте выше.
1👍30🔥15
OpenAI выкатывает обновление за обновлением — так что я продолжу постить. Сгенерил картинку Папы со Снуп Доггом… в Sora.
Итак, в Sora появилась опция генерации статичных изображений (скорее всего тот же GPT 4o но данных пока не нашел). Картинки, как вы правильно догадались, можно в последствии анимировать.
Ушел тестировать. Генерить тут.
p.s. Чтобы совсем не спамить — накидаю в комментарии картиночек.
p.p.s Первые впечатления — если правильно задавать промты, то все тип-топ. См. комментарии к этому посту.
Итак, в Sora появилась опция генерации статичных изображений (скорее всего тот же GPT 4o но данных пока не нашел). Картинки, как вы правильно догадались, можно в последствии анимировать.
Ушел тестировать. Генерить тут.
p.s. Чтобы совсем не спамить — накидаю в комментарии картиночек.
p.p.s Первые впечатления — если правильно задавать промты, то все тип-топ. См. комментарии к этому посту.
1👍21🔥1🤣1
В Kling полезнейшее обновление — генерация звуков к видео.
Загружаете свое видео или выбираете из библиотеки то, что сгенерили в Клинге, DeepSeek сам предложит промт, который можно отредактировать при желании. Нажимаете Generate и ждете. А потом случается магия.
Пробуем тут.
Загружаете свое видео или выбираете из библиотеки то, что сгенерили в Клинге, DeepSeek сам предложит промт, который можно отредактировать при желании. Нажимаете Generate и ждете. А потом случается магия.
Пробуем тут.
🔥17👍5
Итак, публикую обещанное громадное интервью с Сэмом Альтманом, которое объясняет вообще все. Как появился Chat GPT, когда наступит AGI и все такое. Читайте — это и правда интересно.
Поставьте пожалуйста лайки этому материалу на ресурсе VC — это важно, чтобы материал правильно отранжировался и его увидело больше людей. Чтобы поставить лайк можно перейти по ссылке:
https://vc.ru/ai/1894430-sem-altman-o-buduschem-agi
Поставьте пожалуйста лайки этому материалу на ресурсе VC — это важно, чтобы материал правильно отранжировался и его увидело больше людей. Чтобы поставить лайк можно перейти по ссылке:
https://vc.ru/ai/1894430-sem-altman-o-buduschem-agi
vc.ru
Сэм Альтман: "AGI неизбежен, но что это будет — благо или катастрофа — зависит от нас" — AI на vc.ru
Егор Апполонов AI 1м
🔥28👍10
Делюсь очередным реальным кейсом — прислали лукбук коллекции (только вещи), нужна были модели в присланной одежде. На видео — результат.
Хотите научиться также? Приходите на курс "ИИ-кино 2.0". И вы станете гуру видеогенераций. Курс стартует уже завтра, 30го марта.
Присоединяйтесь, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.
🤘 Программа и регистрация ЗДЕСЬ
Хотите научиться также? Приходите на курс "ИИ-кино 2.0". И вы станете гуру видеогенераций. Курс стартует уже завтра, 30го марта.
Присоединяйтесь, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.
🤘 Программа и регистрация ЗДЕСЬ
🔥26👍7💩5
🎬 Специальный гость курса "ИИ-кино 2.0" — Валерия Гай-Германика. Старт курса уже сегодня, 30 марта в 19-00 мск. Запрыгивайте в последний вагон :-)
К курсу ИИ-КИНО 2.0 присоединяется особая гостья — Валерия Гай-Германика, режиссер, каждый фильм которой вызывает широкий резонанс. Ее уникальный стиль, острые темы и яркие визуальные образы — то, чему невозможно научиться по учебнику. Но теперь у вас есть шанс услышать из первых уст, как создаются по-настоящему захватывающие истории, которые говорят с душой зрителя.
На эксклюзивной встрече Валерия раскроет, как работать с эмоцией, где искать настоящие истории, почему важна правда в кадре — и как ИИ может стать новым инструментом режиссера, не заменяя, а усиливая голос автора.
Присоединяйтесь к курсу, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.
🤘 Программа и регистрация ЗДЕСЬ
Это не все сюрпризы курса. Будут еще как минимум 2 супер гостя.
Курс стартует уже сегодня, 30 марта, в 19-00 по московоскому времени.
Будут записи с бессрочным доступом.
Присоединяйтесь, чтобы создавать ии-видео, которые действительно будут привлекать внимание.
К курсу ИИ-КИНО 2.0 присоединяется особая гостья — Валерия Гай-Германика, режиссер, каждый фильм которой вызывает широкий резонанс. Ее уникальный стиль, острые темы и яркие визуальные образы — то, чему невозможно научиться по учебнику. Но теперь у вас есть шанс услышать из первых уст, как создаются по-настоящему захватывающие истории, которые говорят с душой зрителя.
На эксклюзивной встрече Валерия раскроет, как работать с эмоцией, где искать настоящие истории, почему важна правда в кадре — и как ИИ может стать новым инструментом режиссера, не заменяя, а усиливая голос автора.
Присоединяйтесь к курсу, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.
🤘 Программа и регистрация ЗДЕСЬ
Это не все сюрпризы курса. Будут еще как минимум 2 супер гостя.
Курс стартует уже сегодня, 30 марта, в 19-00 по московоскому времени.
Будут записи с бессрочным доступом.
Присоединяйтесь, чтобы создавать ии-видео, которые действительно будут привлекать внимание.
🔥17💩8👍5
Media is too big
VIEW IN TELEGRAM
🎬Держите новый кинчик от "Нейронутых". Фильм "Три поросёнка. Свиное правосудие". Режиссерская версия.
🔫 Страховые схемы, спецназ и нешуточная афера: в этой современной версии классики волк — не злодей, а жертва трех ушлых поросят, которые провернули многоходовочку века.
Переосмыслил сказку "Три поросёнка" — получился острый как лезвие триллер в духе Гая Ричи.
Смотрите, конечно же, со звуком.
Инструменты: Chat GPT, Gemini, Veo2, Kling, ElevenLabs, Topaz Video AI + живая озвучка (писали реальных людей в студии — кроме 2-х, сгенеренных ИИ голосов, угадаете каких?).
Ставьте лайки. Ну или что вы там захотите поставить.
🔫 Страховые схемы, спецназ и нешуточная афера: в этой современной версии классики волк — не злодей, а жертва трех ушлых поросят, которые провернули многоходовочку века.
Переосмыслил сказку "Три поросёнка" — получился острый как лезвие триллер в духе Гая Ричи.
Смотрите, конечно же, со звуком.
Инструменты: Chat GPT, Gemini, Veo2, Kling, ElevenLabs, Topaz Video AI + живая озвучка (писали реальных людей в студии — кроме 2-х, сгенеренных ИИ голосов, угадаете каких?).
Ставьте лайки. Ну или что вы там захотите поставить.
6🔥130💩26👍11🥰5🤬1💯1🙈1
Media is too big
VIEW IN TELEGRAM
Когда еще не было ни Kling, ни MiniMax, ни Sora и уж тем более Veo2, я много месяцев работал на максимальном тарифе Gen-2 (а потом в Gen-3) как безальтернативном генераторе ии-видео.
Я много раз писал на канале, как плох Gen-3. Отписался 9 месяцев назад и с тех пор не использовал вообще.
После релиза Gen-4, о котором идет речь в этом видео (перевел на русский, все для вас), снова иду оплачивать подписку. Все протестирую и дам развернутое заключение.
Я много раз писал на канале, как плох Gen-3. Отписался 9 месяцев назад и с тех пор не использовал вообще.
После релиза Gen-4, о котором идет речь в этом видео (перевел на русский, все для вас), снова иду оплачивать подписку. Все протестирую и дам развернутое заключение.
🔥43👍24
Media is too big
VIEW IN TELEGRAM
Этот проект я начал еще в декабре. Делал его медленно, время от времени. В какой-то момент хотел все бросить, потому что по пути выяснилось, что все гораздо сложнее, чем казалось на первый взгляд. Собрать редкие архивные фото "Кино". Отреставрировать — фото в хорошем качестве в сети попросту нет. Оживить. Сложить историю... Нужно стальное терпение.
Я не бросил и все же решил доделать это видео. Всегда хотелось посмотреть клип на любимую песню "Печаль" в хорошем качестве.
Так получилось это музыкальное видео, в котором — только документальная фотохроника. Я отреставрировал реальные кадры и оживил. Проект для меня важный. Личный.
Итак. Я рад, что могу сделать эту премьеру на "Нейронутых"
Я не бросил и все же решил доделать это видео. Всегда хотелось посмотреть клип на любимую песню "Печаль" в хорошем качестве.
Так получилось это музыкальное видео, в котором — только документальная фотохроника. Я отреставрировал реальные кадры и оживил. Проект для меня важный. Личный.
Итак. Я рад, что могу сделать эту премьеру на "Нейронутых"
7🔥214👍45🥰18💯2