D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
OpenAI выпустил GPT-4. Что в ней нового?

Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.

Основные изменения в новой версии:

🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;

🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;

💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;

😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;

👩‍🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;

GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.

GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵‍💫.

💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.
5🔥3👍2
Media is too big
VIEW IN TELEGRAM
Google спешит напомнить, что у него тоже есть ИИ 👋

🏃‍♂️ Google очень не хочет прийти последним в ИИ-гонке, и поэтому в один день с анонсом GPT-4 объявил об интеграции искусственного интеллекта в свои офисные инструменты, объединенные общим названием Workspace: Gmail, Документы, Таблицы, Meet, Календарь и другие.

📩 📄 На первом этапе алгоритмы добавят в почтовый сервис и текстовый редактор. В Документах теперь, например, можно задать искусственному интеллекту тему для текста и приложение сгенерирует черновик. Gmail благодаря ИИ теперь может написать за вас ответ и подготовить пересказ слишком длинного письма.

🤖 ИИ обещают интегрировать в остальные сервисы каждые пару недель, так что скоро ждите, в том числе, генеративную нейросеть в Презентациях, которая создаст по текстовой подсказке иллюстрации для слайдов.

🙁 Но не спешите радоваться — пока прокачанные Gmail и Документы будут доступны только «проверенным» пользователям в США. Кажется, это еще один признак того, что Google очень торопится со своими ИИ-анонсами.
🤔6😱1
BMW показал дисплей, который займет всё лобовое стекло автомобиля 😱

Panoramic Vision представляет собой проекционный дисплей, который выводит важную информацию по всей площади лобового стекла автомобиля — не только для водителя, но и для пассажира ℹ️.

В немецкой компании говорят, что Panoramic Vision позволит водителю в принципе не отводить взгляд от дороги, что естественно повышает безопасность поездки 👷‍♂️.

Дисплей начнут устанавливать в электромобилях концерна уже в 2025 году.

🛸 Нечто похожее на Panoramic Vision, но еще более футуристичное, BMW показывал в январе на презентации концепт-кара Vision Dee (см. видео с девушкой). Там на лобовое стекло проецировалась не только важная информация, а целые 3D-сцены.
🔥11👍1
Сооснователь OpenAI запустил цифровой паспорт для децентрализованного интернета будущего 🛃

Стартап Worldcoin представил технологию World ID — децентрализованный цифровой паспорт, который должен упростить для пользователей процесс подтверждения личности в интернете, при этом не требуя раскрывать персональные данные 🤫.

Один из основателей Worldcoin — это Сэм Альтман, глава и сооснователь компании OpenAI.

🔐 World ID хранится локально на смартфоне пользователя и использует криптографический протокол доказательства с нулевым разглашением (Zero-Knowledge Proof) для подтверждения личности. Решение в перспективе закрывает важный вопрос, о том, кому должны принадлежать ваши персональные данные — вам или бигтехам, которые сегодня зарабатывают на них миллиарды долларов.

Как объясняют создатели, цифровой паспорт не привязан к биометрии пользователя, его телефону или любой другой личной информации. World ID можно сравнить с печатью в документе, которая подтверждает его подлинность, а в данном случае — подтверждает, что пользователь не бот 🤖. При этом, где именно вы использовали World ID не знают даже разработчики приложения (так они утверждают, по крайней мере) 🙈.

✖️ 🇷🇺✖️ Если вы живете не в России, то можете уже завести себе модную штуку, скачав соответствующее приложение. Правда, толку от него сейчас мало, так как крупных сервисов, которые поддерживали бы продвинутую аутентификацию, сейчас попросту нет. Первым девайсом, который полноценно поддерживает World ID, стал The Orb — сканер сетчатки глаза, разработанный Worldcoin, и позволяющий получить виртуальное удостоверение личности.
🔥81
Midjourney научился корректно генерировать пальцы и зубы, на ИИ-адвоката подали в суд, Siri мешает Apple в разработке чат-бота — и другие важные новости за неделю

Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;

В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);

Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;

Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;

Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;

Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;

МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.

*Организации, запрещенные на территории РФ
👍62
Media is too big
VIEW IN TELEGRAM
Microsoft показал умного ассистента Copilot — помощника-скрепку на анаболиках 📎

👨‍✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.

📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.

😵‍💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.

🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.
🔥7👍1
🦙 В Стэнфорде конкурента GPT обучили за $600, сэкономив миллионы долларов

Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.

✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.

🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.

✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.

*Организация, запрещенная на территории РФ
🔥8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📝➡️🖼 Runway показал новую версию Text2Video модели Gen

В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.

Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.

Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.
😱4👍2🔥21
Media is too big
VIEW IN TELEGRAM
👩 Очень умный почтовый клиент с голосом Скарлетт Йоханссон

Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️‍♀️.

📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.

🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.
🔥6👍21😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ, который создаст вашего клона для маркетинговых видео 👥

Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.

📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео .

🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.

💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Создатели Assassin’s Creed анонсировали нейросеть, которая пишет диалоги для видеоигр 🎮

💬 Ghostwriter от французского издателя и разработчика игр UbiSoft может сгенерировать диалог по описанию персонажей и контексту, в котором происходит диалог. Инструмент генерирует 2 варианта диалога на заданную тему, которые пользователь потом может отредактировать. На основе правок ИИ создает новые варианты, с каждым изменением все более приближенные к «идеалу».

👥 UbiSoft планирует использовать Ghostwriter для генерации диалогов NPC — неигровых персонажей, которые выступают в роли «массовки» на уровнях, или персонажей, которые выдают главному герою миссии для выполнения ⚔️.

Теперь основная задача — эффективно интегрировать Ghostwriter в процесс разработки. В будущем компания хочет разработать платформу, которая позволит игровым сценаристам создавать кастомные ИИ-модели под игры, над которыми они работают в данный момент 🤖.
6🔥1
☄️ Epic показала ультрареалистичный mocap, для которого понадобится только один iPhone

Разработчики видеоигры Gears of War показали результаты работы приложения MetaHuman Animator, которое создает лицевую анимацию на основе видео, записанного на обычный айфон (на один айфон, а не на шесть) 📱.

Актер просто говорит текст, глядя в камеру, а затем на компьютере c установленным MetaHuman за несколько минут создается 3D-анимация 😱. Если вам интересны подробности, то полную версию презентации можно посмотреть здесь.

В ходе презентации разработчики также показали, как технология будет выглядеть в деле — на примере игры Hellblade 2, которая должна выйти в этом году 🔥.

Epic обещают выпустить MetaHuman Animator уже летом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8😱42🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI, кажется, решил одну из главных проблем ChatGPT 💪

Это проблема устаревшей информации, на которой обучался чат-бот, ограниченной концом 2021 года. Теперь сервис поддерживает плагины, которые, в частности, позволят ему залезать в интернет за свежими данными.

☝️ Сейчас набор расширений и число пользователей, которые смогут их протестировать, ограничены. На старте доступны плагины для Slack, Shopify, туристического сервиса Expedia, интеграционной платформы Zappier и других — всего 12 расширений. Кроме того — и это, пожалуй, наиболее многообещающее — OpenAI добавили в ChatGPT поддержку экспериментального браузера, который и позволит чат-боту искать в интернете актуальную информацию (проблема надежности источников при этом все еще остается) 🌐.

Важность появления плагинов можно сравнить с моментом, когда Apple разрешил сторонним разработчикам создавать приложения для своих устройств. То есть ChatGPT постепенно превращается из сервиса в настоящую платформу ✔️.

В демо (см. видео) разработчики показали, как ChatGPT может подобрать подходящий ресторан с помощью плагина OpenTable, затем найти рецепт салата и рассчитать его калорийность с помощью расширения Wolfram, а потом создать список покупок, используя Instacart.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍4
Не все так однозначно: чат-боты Microsoft и Google распространяют фейки, ссылаясь друг на друга 🤥

На это обратил внимание Verge. На данный момент ошибку, о которой идет речь дальше, исправили.

Оказывается, если у чат-бота, встроенного в поисковик Bing, спросить, отключили ли его конкурента — чат-бот Bard от Google — то он ответит утвердительно 🔌.

В качестве источника этой информации Bing указывает — следите за руками — заметку, посвященную твиту, в котором обсуждается шуточный комментарий на сайте Hacker News 🤯. В комментарии пользователь рассказывал, что спросил у Bard, когда его закроют, на что Bard ответил, что его уже закрыли — 21 марта 2023 года, потому что чат-ботом никто не пользовался ☹️.

Да, мы понимаем, что разработчики и Bing, и Bard предупреждают, что их модели работают не идеально (и сами об этом уже несколько раз писали). Но новый случай — еще одна иллюстрация того, что ИИ-поисковики в ближайшие месяцы, а возможно и годы, точно не заменят свои привычные «ламповые» версии 📻. Это подтверждает и недавнее исследование, согласно которому GPT-4 даже «лучше» распространяет фейки, чем предыдущая версия языковой модели.

Кстати, предупреждения от разработчиков работают так себе. Недавно в соцсетях завирусился тред журналиста британской газеты Guardian Криса Морана. Моран рассказал, что с ними связался коллега, который хотел узнать, почему Guardian удалил один из материалов с сайта. Оказалось, что такого материала никогда не было — точнее был, но только в воображении ChatGPT, который на этот текст ссылался 🤦.
🤔6👍3
Microsoft запустит магазин приложений на iOS, Coca-Cola выпустила нейросеть, американские сценаристы смогут пользоваться ChatGPT — и другие важные новости за неделю

Microsoft уже в следующем году может запустить свои магазины приложений для устройств на iOS и Android. Все дело в том, что в ЕС в 2024 году вступают в силу законы, которые обязывают Apple и Google дать возможность пользователям устанавливать приложения из сторонних маркетплейсов;

У Adobe теперь тоже есть генеративная нейросеть для создания изображений — Firefly. В компании говорят, что в отличие от нейросетей конкурентов, их алгоритм тренировали только на лицензированном контенте или контенте, который не защищен копирайтом. В будущем Adobe планирует платить авторам, которые поделятся своими работами с Firefly;

Также нейросеть для создания изображений теперь есть у поисковика Bing (работает на Dall-E) и даже у Coca-Cola — нейрогазировка тоже работает на Dall-E и на новейшей GPT-4;

Создатели браузера Mozilla запускают новый стартап, который займется разработкой ИИ с открытым кодом, «которому можно доверять». В компании объясняют, что главными для такой модели будут интересы человека, а также «открытость и ответственность». Узнать, что это означает на практике, можно будет уже в этом году, когда Mozilla должна представить первые наработки;

Гильдия сценаристов США (WGA) предложила официально разрешить использование искусственного интеллекта при написании сценариев, но с некоторыми оговорками. Например, сценарист не должен будет указывать, что использовал ChatGPT, когда работал над текстом;

ВКонтакте работает над собственным фото и видеоредактором на основе ML-алгоритмов и с возможностями нейросетей;

Яндекс выложил в открытый доступ исходный код платформы для работы с большими данными YTSaurus. В самой компании платформу используют беспилотники и суперкомпьютеры;.
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 ИИ-платформа, которая сама организует съемки фильма

Filmustage в первую очередь известна своими способностями при работе со сценариями — например, программа может выделить в тексте персонажей, локации, костюмы, реквизит. Чтобы разбить сценарий из 100 сцен на составные части, программе понадобится 1 минута ✂️.

Еще Filmustage сможет сделать пересказ сценария, указав для каждой сцены сколько понадобится актеров, массовки, оборудования и так далее. Недавно разработчики добавили новые функции: скажем, теперь программа может создать расписание съемок, подсчитав время на работу. Также программа напомнит о необходимых разрешениях и мерах безопасности, если в съемках, например, участвуют животные 🐈.

Недавно платформа, основанная выходцами из Беларуси, получила от инвесторов на развитие еще $550 тыс 🤑. Деньги пойдут, в частности, на локализацию программы на испанский, французский и немецкий языки (сейчас программа доступна только на английском). Также в планах у стартапа есть интеграция с крупными маркетплейсами, чтобы съемочная группа могла прямо из Filmustage заказать необходимые вещи 🛍.
🔥9👍3
🐑 Dolly — еще один «бюджетный» конкурент ChatGPT с открытым кодом

На прошлой неделе мы рассказывали про аналог ChatGPT под названием Alpaca, обучение которого стоит в сотни раз дешевле, чем модели OpenAI, за счет использования синтетической информации, сгенерированной с помощью GPT 👛.

👏 Теперь встречайте Dolly — клона Alpaca, названного в честь овечки-клона Долли, задача которого — демократизация доступа к большим языковым моделям. Программисты из компании Databricks говорят, что Dolly можно обучить на небольшом количестве информации, потратив всего $30 и 3 часа работы. При этом вам не потребуется суперкомпьютер за несколько десятков тысяч долларов.

За основу при создании Dolly была взята языковая модель Eleuther 2020 года (в мире ИИ — целая вечность) 👨‍🦳. У Eleuther всего 6 млрд параметров по сравнению со 135 млрд у GPT. Старенькую модель модифицировали с помощью информации, полученной от упомянутой выше Alpaca, и добились способности следовать пользовательским промптам, которой в оригинальной версии не было. Теперь она может работать в режиме чат-бота, генерировать текст и брейнстормить на заданную тему 💪.

Из этого Databricks делают предположение, что крутость того же ChatGPT именно в качестве информации, на которой тренировали чат-бот, а не в технической продвинутости самой модели ℹ️. Ведь Dolly, поясняют разработчики, за очень короткий срок научилась схожим способностям, хотя и не на таком высоком уровне.
🔥11👍21
This media is not supported in your browser
VIEW IN TELEGRAM
В поисковике Bing появились сторис, сгенерированные нейросетью 🫡

Microsoft продолжает прикручивать к обновленному Bing ИИ-обвесы. Теперь настал черед сторис, которые поисковик сгенерирует на основе пользовательского запроса 🔍. Вместо того чтобы читать полотно текста, решили в Microsoft, пользователю удобнее будет получить нужную информацию в сжатом виде и разных форматах: видео, аудио, изображения и текст. ИИ сам не генерирует видео и изображения, а подбирает релевантные примеры на основе алгоритмов 👍.

Сторис, судя по всему, генерируются рандомно: иногда на один и тот же запрос они появляются, иногда — нет 🤔.

❗️Чтобы протестировать функцию, советуем также войти в Bing под учетной записью Microsoft.

Сторис поддерживают запросы на нескольких языках, включая русский 🇷🇺.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9