D. Lab

OpenAI выпустил GPT-4. Что в ней нового?

Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.

Основные изменения в новой версии:

🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;

🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;

💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;

😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;

👩‍🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;

GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.

GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵‍💫.

💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.

❤5🔥3👍2

728 views10:32

Google спешит напомнить, что у него тоже есть ИИ 👋

🏃‍♂️ Google очень не хочет прийти последним в ИИ-гонке, и поэтому в один день с анонсом GPT-4 объявил об интеграции искусственного интеллекта в свои офисные инструменты, объединенные общим названием Workspace: Gmail, Документы, Таблицы, Meet, Календарь и другие.

📩 📄 На первом этапе алгоритмы добавят в почтовый сервис и текстовый редактор. В Документах теперь, например, можно задать искусственному интеллекту тему для текста и приложение сгенерирует черновик. Gmail благодаря ИИ теперь может написать за вас ответ и подготовить пересказ слишком длинного письма.

🤖 ИИ обещают интегрировать в остальные сервисы каждые пару недель, так что скоро ждите, в том числе, генеративную нейросеть в Презентациях, которая создаст по текстовой подсказке иллюстрации для слайдов.

🙁 Но не спешите радоваться — пока прокачанные Gmail и Документы будут доступны только «проверенным» пользователям в США. Кажется, это еще один признак того, что Google очень торопится со своими ИИ-анонсами.

🤔6😱1

757 views08:30

0:29

0:10

BMW показал дисплей, который займет всё лобовое стекло автомобиля 😱

Panoramic Vision представляет собой проекционный дисплей, который выводит важную информацию по всей площади лобового стекла автомобиля — не только для водителя, но и для пассажира ℹ️.

В немецкой компании говорят, что Panoramic Vision позволит водителю в принципе не отводить взгляд от дороги, что естественно повышает безопасность поездки 👷‍♂️.

Дисплей начнут устанавливать в электромобилях концерна уже в 2025 году.

🛸 Нечто похожее на Panoramic Vision, но еще более футуристичное, BMW показывал в январе на презентации концепт-кара Vision Dee (см. видео с девушкой). Там на лобовое стекло проецировалась не только важная информация, а целые 3D-сцены.

🔥11👍1

702 views16:06

Сооснователь OpenAI запустил цифровой паспорт для децентрализованного интернета будущего 🛃

Стартап Worldcoin представил технологию World ID — децентрализованный цифровой паспорт, который должен упростить для пользователей процесс подтверждения личности в интернете, при этом не требуя раскрывать персональные данные 🤫.

Один из основателей Worldcoin — это Сэм Альтман, глава и сооснователь компании OpenAI.

🔐 World ID хранится локально на смартфоне пользователя и использует криптографический протокол доказательства с нулевым разглашением (Zero-Knowledge Proof) для подтверждения личности. Решение в перспективе закрывает важный вопрос, о том, кому должны принадлежать ваши персональные данные — вам или бигтехам, которые сегодня зарабатывают на них миллиарды долларов.

Как объясняют создатели, цифровой паспорт не привязан к биометрии пользователя, его телефону или любой другой личной информации. World ID можно сравнить с печатью в документе, которая подтверждает его подлинность, а в данном случае — подтверждает, что пользователь не бот 🤖. При этом, где именно вы использовали World ID не знают даже разработчики приложения (так они утверждают, по крайней мере) 🙈.

✖️ 🇷🇺✖️ Если вы живете не в России, то можете уже завести себе модную штуку, скачав соответствующее приложение. Правда, толку от него сейчас мало, так как крупных сервисов, которые поддерживали бы продвинутую аутентификацию, сейчас попросту нет. Первым девайсом, который полноценно поддерживает World ID, стал The Orb — сканер сетчатки глаза, разработанный Worldcoin, и позволяющий получить виртуальное удостоверение личности.

🔥8❤1

808 viewsedited 15:35

Midjourney научился корректно генерировать пальцы и зубы, на ИИ-адвоката подали в суд, Siri мешает Apple в разработке чат-бота — и другие важные новости за неделю

✅ Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;

✅ В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);

✅ Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;

✅Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;

✅Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;

✅ Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;

✅ МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.

*Организации, запрещенные на территории РФ

👍6❤2

695 views09:00

Microsoft показал умного ассистента Copilot — помощника-скрепку на анаболиках 📎

👨‍✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.

📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.

😵‍💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.

🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.

🔥7👍1

1.19K views11:40

🦙 В Стэнфорде конкурента GPT обучили за $600, сэкономив миллионы долларов

Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.

✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.

🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.

✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.

*Организация, запрещенная на территории РФ

🔥8👍1

891 viewsedited 16:09

0:27

📝➡️🖼 Runway показал новую версию Text2Video модели Gen

В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.

Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.

Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.

😱4👍2🔥2❤1

1.18K viewsedited 14:54

👩 Очень умный почтовый клиент с голосом Скарлетт Йоханссон

Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️‍♀️.

📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.

🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.

🔥6👍2❤1😱1

824 views10:40

0:48

ИИ, который создаст вашего клона для маркетинговых видео 👥

Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.

📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео ✅.

🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.

💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.

🔥5👍1

771 views15:01

0:36

Создатели Assassin’s Creed анонсировали нейросеть, которая пишет диалоги для видеоигр 🎮

💬 Ghostwriter от французского издателя и разработчика игр UbiSoft может сгенерировать диалог по описанию персонажей и контексту, в котором происходит диалог. Инструмент генерирует 2 варианта диалога на заданную тему, которые пользователь потом может отредактировать. На основе правок ИИ создает новые варианты, с каждым изменением все более приближенные к «идеалу».

👥 UbiSoft планирует использовать Ghostwriter для генерации диалогов NPC — неигровых персонажей, которые выступают в роли «массовки» на уровнях, или персонажей, которые выдают главному герою миссии для выполнения ⚔️.

Теперь основная задача — эффективно интегрировать Ghostwriter в процесс разработки. В будущем компания хочет разработать платформу, которая позволит игровым сценаристам создавать кастомные ИИ-модели под игры, над которыми они работают в данный момент 🤖.

❤6🔥1

995 viewsedited 12:59

0:24

1:04

☄️

Epic показала ультрареалистичный mocap, для которого понадобится только один iPhone

Разработчики видеоигры Gears of War показали результаты работы приложения MetaHuman Animator, которое создает лицевую анимацию на основе видео, записанного на обычный айфон (на один айфон, а не на шесть) 📱.

Актер просто говорит текст, глядя в камеру, а затем на компьютере c установленным MetaHuman за несколько минут создается 3D-анимация 😱. Если вам интересны подробности, то полную версию презентации можно посмотреть здесь.

В ходе презентации разработчики также показали, как технология будет выглядеть в деле — на примере игры Hellblade 2, которая должна выйти в этом году 🔥.

Epic обещают выпустить MetaHuman Animator уже летом.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8😱4❤2🤩1

788 views10:21

0:59

OpenAI, кажется, решил одну из главных проблем ChatGPT 💪

Это проблема устаревшей информации, на которой обучался чат-бот, ограниченной концом 2021 года. Теперь сервис поддерживает плагины, которые, в частности, позволят ему залезать в интернет за свежими данными.

☝️ Сейчас набор расширений и число пользователей, которые смогут их протестировать, ограничены. На старте доступны плагины для Slack, Shopify, туристического сервиса Expedia, интеграционной платформы Zappier и других — всего 12 расширений. Кроме того — и это, пожалуй, наиболее многообещающее — OpenAI добавили в ChatGPT поддержку экспериментального браузера, который и позволит чат-боту искать в интернете актуальную информацию (проблема надежности источников при этом все еще остается) 🌐.

Важность появления плагинов можно сравнить с моментом, когда Apple разрешил сторонним разработчикам создавать приложения для своих устройств. То есть ChatGPT постепенно превращается из сервиса в настоящую платформу ✔️.

В демо (см. видео) разработчики показали, как ChatGPT может подобрать подходящий ресторан с помощью плагина OpenTable, затем найти рецепт салата и рассчитать его калорийность с помощью расширения Wolfram, а потом создать список покупок, используя Instacart.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍4

735 views13:50