Нейронутые | ИИ (Егор Апполонов)
13.6K subscribers
1.19K photos
286 videos
1 file
345 links
Я — Егор Апполонов, эксперт по ии-видео. Победитель 3 международных конкурсов ии-фильмов. Связь @egorevna

Портфолио: https://egorappolonov.ru/ и @aigencydigital

Курс по ии-видео: https://aifilm.online/

РКН https://clck.ru/3NNPKh
Download Telegram
И неожиданная новость дня — Sora официально перешла на полный безлимит на всех тарифах (включая Plus за $20 в месяц).

Итак, планы ChatGPT Pro и Plus предлагают неограниченный доступ к Sora. Однако нужно соответствовать условиям использования, которые запрещают, среди прочего:

Злоупотребление использованием, например, автоматическое или программное извлечение данных (например, запрещено писать скрипт, который будет подгружать промты каждые 10 минут).

Распространение учетных данных вашей учетной записи или предоставление вашей учетной записи кому-либо еще.

Перепродажа доступа или использование ChatGPT для поддержки сторонних сервисов.

У OpenAI есть защитные ограждения, помогающие предотвратить неправомерное использование. Вот что пишет команда Альтмана:

"Мы постоянно работаем над улучшением наших систем. Иногда это может повлечь за собой временное ограничение использования вами сервиса".

Комментарий «Нейронутых»: в гонке ии-видео Sora явно уступает конкурентам. Поэтому приходится идти на такие меры, чтобы вовлечь пользователей.

p.s. На тарифе за $20 все равно остается логотип на видео (убрать нельзя), максимальная продолжительность видео — 10 секунд (только с разрешением 480 p), максимальное разрешение — 720 p.

Тариф Pro ($200 в месяц) позволяет делать видео длительностью до 20 секунд, убирает логотип и позволяет генерить в 1080 p.
👍14
Сэм Альтман дал огромное интервью Stratechery — крайне интересное и пожалуй, самое полное за всю историю выступлений основателя OpenAI. Вот яркие цитаты. Сегодня вечером или завтра с утра я выложу полную версию — там минут на 40 чтения (крайне интересного чтения, замечу).

Пока заряжайтесь тут: https://vc.ru/ai/1881791

Кстати, поставьте пожалуйста, лайки на самом VC. Так материал увидит больше людей. Пасиба.
🔥19👍9
У OpenAI появилась новая фича — генерация изображений прямо внутри GPT-4o. Да, теперь ChatGPT может не только понимать картинки, но и создавать их сам, и это работает как магия.

Что умеет обновленная модель GPT-4o:

Генерирует изображения по текстовому описанию, как DALL·E 3, но прямо внутри чата, без переходов.

Можно править изображение в диалоге — просто напишите: «Сделай вечернее освещение» или «А добавь туда кота в шляпе» и т.д.

Все изображения генерируются без водяных знаков и выглядят реалистично, с отличной композицией.

Работает на GPT-4o — значит, быстро, дешево и в реальном времени.

Пример запроса:

«Cделай кота в шляпе с бананом верхом на втором коте». Второй запрос — добавить очки коту-наезднику.

Как включить: Если у вас подписка на ChatGPT Plus, то генерация уже встроена. Просто пишите описание — и будет картинка. Пробуйте, экспериментируйте.

Ссылка на анонс. Примеры изображений — в следующем посте. 👇👇👇
👍9🔥5🤣1
🔥18🤣5👍2
Трамп приехал к избирателям. Фото — РИА-Новости.

В комментариях жара
👍33🤣30🔥5🤬1
Вчера я написал, что в Chat GPT появилась новая фича — генерация изображений прямо внутри GPT-4o. В комментариях сразу же меня обвинили в кликбейтных новостях, говоря, что так и раньше было и никакой новости в этом нет.

Нет, так как стало сейчас, раньше даже и близко не было.

И сейчас я подробно объясню, почему вчера Open AI совершила очередную революцию, хоть этого многие и не заметили.

А произошло реально грандиозное обновление — генерацию встроили в мультимодальную модель GPT-4o. Я тестировал модель всю ночь и могу сказать, что я «немножечко в шоке» — настолько все круто. Итак, что же случилось.

Во время беседы: вы просто общаетесь словами, а Chat GPT запоминает все, что уже обсуждалось, и делает новые картинки, которые логично продолжают предыдущие. Например, если вы вместе придумываете героя для игры, он будет выглядеть одинаково во всех версиях, пока вы уточняете детали — цвет глаз, одежду, стиль и т.д.

Точная визуализация: генерация изображений GPT-4o отличается точной визуализацией текста, точным выполнением промтов и использованием встроенной базы знаний 4o и контекста чата, включая преобразование загруженных изображений или использование их в качестве визуального вдохновения.

GPT‑4o умеет точно следовать вашим описаниям при создании изображений. В то время как другие ИИ путаются, если в сцене больше 5–8 объектов, GPT‑4o спокойно справляется с 10–20 — и правильно расставляет их, учитывая все детали, отношения между ними и их свойства. То есть если вы скажете «красная чашка на синем столе рядом с зеленой книгой», он всё поймет и изобразит именно так.

Эти возможности облегчают создание именно того изображения, которое вы себе представляете, помогая вам более эффективно общаться с помощью визуальных элементов и превращая генерацию изображений в практический инструмент с точностью и мощностью.

Добавилась консистентность персонажей: вы можете воспроизводить героя с высоким уровнем точности.

Фотореалистичность (наконец-то): Dall-e генерила довольно убогие картинки. Благодаря обучению на миллионах разных стилей — от фоток до картин и комиксов — GPT‑4o умеет создавать изображения, которые выглядят правдоподобно и в нужной стилистике. Хотите фотореалистичный портрет? ГПТ сделает так, будто это настоящий снимок. Примеры в следующем посте — и это вау.

Широкий взгляд: создатели обучили модели «совместному восприятию» изображений и текста. Пояснение: модель «видит» не только то, как изображения соотносятся с языком, но и то, как они соотносятся друг с другом. Простыми словами —нейросеть обучили не просто понимать текст и картинки по отдельности, а учиться на связке «текст + изображение одновременно». И даже больше — модель понимает связи между самими изображениями, как они похожи, чем отличаются и что между ними общего. Итог: модель теперь гораздо лучше генерирует картинки, потому что: 1. Понимает, как вещи выглядят. 2. учитывает контекст (если сказано «ночь», делает темно; если «улыбка», рисует улыбку).

Рендеринг текста: картинка стоит тысячи слов, но иногда создание нескольких слов в нужном месте может повысить смысл изображения. Способность 4o сочетать точные символы с изображениями превращает генерацию изображений в инструмент визуальной коммуникации.

Цифровое зрение: GPT‑4o может «считывать» загруженные вами изображения, запоминать их детали и использовать эту информацию, чтобы создавать новые картинки в том же стиле или с учетом увиденного (и даже добавить на те же картинки что-то новое) Например, вы загрузили фото логотипа — и ИИ потом сам добавляет его на футболки, постеры или в дизайн, не спрашивая каждый раз заново.

Ложка дегтя: модель не идеальна. На данный момент есть много ограничений, над устранением которых инженеры, как они сами говорят «будут» работать путем улучшения модели после первоначального запуска.

Мой прогноз — в скором времени Chat GPT переименуют. Сэм Альтман, уверен, уже вовсю думает об этом. Да, я помню, что обещал вам вот в этом посте огромное интервью с ним. Обязательно опубликую. Скоро.

Я никогда не пишу на "Нейронутых" во имя кликбейта. Я проверяю информацию и публикую.
👍36🙈1
Эти изобаражения сделал Chat GPT. Да, вы не ослышались. С убогими генерациями DALL-E покончено. Новость о том, как это стало возможно — в посте выше.
1👍30🔥15
OpenAI выкатывает обновление за обновлением — так что я продолжу постить. Сгенерил картинку Папы со Снуп Доггом… в Sora.

Итак, в Sora появилась опция генерации статичных изображений (скорее всего тот же GPT 4o но данных пока не нашел). Картинки, как вы правильно догадались, можно в последствии анимировать.

Ушел тестировать. Генерить тут.

p.s. Чтобы совсем не спамить — накидаю в комментарии картиночек.

p.p.s Первые впечатления — если правильно задавать промты, то все тип-топ. См. комментарии к этому посту.
1👍21🔥1🤣1
А еще чат GPT 4o теперь умеет менять стиль картинок на любой стиль. Вот вам Миядзаки. Узнали фильм?
2👍51
Ну и еще немного нового GPT 4o
1🤣28🔥19🥰2
Простите, не могу остановиться.
2🔥59🤣16💩6👍5
В Kling полезнейшее обновление — генерация звуков к видео.

Загружаете свое видео или выбираете из библиотеки то, что сгенерили в Клинге, DeepSeek сам предложит промт, который можно отредактировать при желании. Нажимаете Generate и ждете. А потом случается магия.

Пробуем тут.
🔥17👍5
Итак, публикую обещанное громадное интервью с Сэмом Альтманом, которое объясняет вообще все. Как появился Chat GPT, когда наступит AGI и все такое. Читайте — это и правда интересно.

Поставьте пожалуйста лайки этому материалу на ресурсе VC — это важно, чтобы материал правильно отранжировался и его увидело больше людей. Чтобы поставить лайк можно перейти по ссылке:

https://vc.ru/ai/1894430-sem-altman-o-buduschem-agi
🔥28👍10
Делюсь очередным реальным кейсом — прислали лукбук коллекции (только вещи), нужна были модели в присланной одежде. На видео — результат.

Хотите научиться также? Приходите на курс "ИИ-кино 2.0". И вы станете гуру видеогенераций. Курс стартует уже завтра, 30го марта.

Присоединяйтесь, это будет 15 живых эфиров (все участники получат записи с бессрочным доступом) не только по генерации видео, но также по сторителлингу, написанию сценариев, созданию рекламы и не только.

🤘 Программа и регистрация ЗДЕСЬ
🔥26👍7💩5