D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Midjourney научился корректно генерировать пальцы и зубы, на ИИ-адвоката подали в суд, Siri мешает Apple в разработке чат-бота — и другие важные новости за неделю

Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;

В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);

Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;

Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;

Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;

Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;

МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.

*Организации, запрещенные на территории РФ
👍62
Media is too big
VIEW IN TELEGRAM
Microsoft показал умного ассистента Copilot — помощника-скрепку на анаболиках 📎

👨‍✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.

📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.

😵‍💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.

🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.
🔥7👍1
🦙 В Стэнфорде конкурента GPT обучили за $600, сэкономив миллионы долларов

Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.

✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.

🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.

✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.

*Организация, запрещенная на территории РФ
🔥8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📝➡️🖼 Runway показал новую версию Text2Video модели Gen

В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.

Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.

Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.
😱4👍2🔥21
Media is too big
VIEW IN TELEGRAM
👩 Очень умный почтовый клиент с голосом Скарлетт Йоханссон

Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️‍♀️.

📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.

🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.
🔥6👍21😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ, который создаст вашего клона для маркетинговых видео 👥

Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.

📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео .

🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.

💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Создатели Assassin’s Creed анонсировали нейросеть, которая пишет диалоги для видеоигр 🎮

💬 Ghostwriter от французского издателя и разработчика игр UbiSoft может сгенерировать диалог по описанию персонажей и контексту, в котором происходит диалог. Инструмент генерирует 2 варианта диалога на заданную тему, которые пользователь потом может отредактировать. На основе правок ИИ создает новые варианты, с каждым изменением все более приближенные к «идеалу».

👥 UbiSoft планирует использовать Ghostwriter для генерации диалогов NPC — неигровых персонажей, которые выступают в роли «массовки» на уровнях, или персонажей, которые выдают главному герою миссии для выполнения ⚔️.

Теперь основная задача — эффективно интегрировать Ghostwriter в процесс разработки. В будущем компания хочет разработать платформу, которая позволит игровым сценаристам создавать кастомные ИИ-модели под игры, над которыми они работают в данный момент 🤖.
6🔥1
☄️ Epic показала ультрареалистичный mocap, для которого понадобится только один iPhone

Разработчики видеоигры Gears of War показали результаты работы приложения MetaHuman Animator, которое создает лицевую анимацию на основе видео, записанного на обычный айфон (на один айфон, а не на шесть) 📱.

Актер просто говорит текст, глядя в камеру, а затем на компьютере c установленным MetaHuman за несколько минут создается 3D-анимация 😱. Если вам интересны подробности, то полную версию презентации можно посмотреть здесь.

В ходе презентации разработчики также показали, как технология будет выглядеть в деле — на примере игры Hellblade 2, которая должна выйти в этом году 🔥.

Epic обещают выпустить MetaHuman Animator уже летом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8😱42🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI, кажется, решил одну из главных проблем ChatGPT 💪

Это проблема устаревшей информации, на которой обучался чат-бот, ограниченной концом 2021 года. Теперь сервис поддерживает плагины, которые, в частности, позволят ему залезать в интернет за свежими данными.

☝️ Сейчас набор расширений и число пользователей, которые смогут их протестировать, ограничены. На старте доступны плагины для Slack, Shopify, туристического сервиса Expedia, интеграционной платформы Zappier и других — всего 12 расширений. Кроме того — и это, пожалуй, наиболее многообещающее — OpenAI добавили в ChatGPT поддержку экспериментального браузера, который и позволит чат-боту искать в интернете актуальную информацию (проблема надежности источников при этом все еще остается) 🌐.

Важность появления плагинов можно сравнить с моментом, когда Apple разрешил сторонним разработчикам создавать приложения для своих устройств. То есть ChatGPT постепенно превращается из сервиса в настоящую платформу ✔️.

В демо (см. видео) разработчики показали, как ChatGPT может подобрать подходящий ресторан с помощью плагина OpenTable, затем найти рецепт салата и рассчитать его калорийность с помощью расширения Wolfram, а потом создать список покупок, используя Instacart.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍4
Не все так однозначно: чат-боты Microsoft и Google распространяют фейки, ссылаясь друг на друга 🤥

На это обратил внимание Verge. На данный момент ошибку, о которой идет речь дальше, исправили.

Оказывается, если у чат-бота, встроенного в поисковик Bing, спросить, отключили ли его конкурента — чат-бот Bard от Google — то он ответит утвердительно 🔌.

В качестве источника этой информации Bing указывает — следите за руками — заметку, посвященную твиту, в котором обсуждается шуточный комментарий на сайте Hacker News 🤯. В комментарии пользователь рассказывал, что спросил у Bard, когда его закроют, на что Bard ответил, что его уже закрыли — 21 марта 2023 года, потому что чат-ботом никто не пользовался ☹️.

Да, мы понимаем, что разработчики и Bing, и Bard предупреждают, что их модели работают не идеально (и сами об этом уже несколько раз писали). Но новый случай — еще одна иллюстрация того, что ИИ-поисковики в ближайшие месяцы, а возможно и годы, точно не заменят свои привычные «ламповые» версии 📻. Это подтверждает и недавнее исследование, согласно которому GPT-4 даже «лучше» распространяет фейки, чем предыдущая версия языковой модели.

Кстати, предупреждения от разработчиков работают так себе. Недавно в соцсетях завирусился тред журналиста британской газеты Guardian Криса Морана. Моран рассказал, что с ними связался коллега, который хотел узнать, почему Guardian удалил один из материалов с сайта. Оказалось, что такого материала никогда не было — точнее был, но только в воображении ChatGPT, который на этот текст ссылался 🤦.
🤔6👍3
Microsoft запустит магазин приложений на iOS, Coca-Cola выпустила нейросеть, американские сценаристы смогут пользоваться ChatGPT — и другие важные новости за неделю

Microsoft уже в следующем году может запустить свои магазины приложений для устройств на iOS и Android. Все дело в том, что в ЕС в 2024 году вступают в силу законы, которые обязывают Apple и Google дать возможность пользователям устанавливать приложения из сторонних маркетплейсов;

У Adobe теперь тоже есть генеративная нейросеть для создания изображений — Firefly. В компании говорят, что в отличие от нейросетей конкурентов, их алгоритм тренировали только на лицензированном контенте или контенте, который не защищен копирайтом. В будущем Adobe планирует платить авторам, которые поделятся своими работами с Firefly;

Также нейросеть для создания изображений теперь есть у поисковика Bing (работает на Dall-E) и даже у Coca-Cola — нейрогазировка тоже работает на Dall-E и на новейшей GPT-4;

Создатели браузера Mozilla запускают новый стартап, который займется разработкой ИИ с открытым кодом, «которому можно доверять». В компании объясняют, что главными для такой модели будут интересы человека, а также «открытость и ответственность». Узнать, что это означает на практике, можно будет уже в этом году, когда Mozilla должна представить первые наработки;

Гильдия сценаристов США (WGA) предложила официально разрешить использование искусственного интеллекта при написании сценариев, но с некоторыми оговорками. Например, сценарист не должен будет указывать, что использовал ChatGPT, когда работал над текстом;

ВКонтакте работает над собственным фото и видеоредактором на основе ML-алгоритмов и с возможностями нейросетей;

Яндекс выложил в открытый доступ исходный код платформы для работы с большими данными YTSaurus. В самой компании платформу используют беспилотники и суперкомпьютеры;.
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 ИИ-платформа, которая сама организует съемки фильма

Filmustage в первую очередь известна своими способностями при работе со сценариями — например, программа может выделить в тексте персонажей, локации, костюмы, реквизит. Чтобы разбить сценарий из 100 сцен на составные части, программе понадобится 1 минута ✂️.

Еще Filmustage сможет сделать пересказ сценария, указав для каждой сцены сколько понадобится актеров, массовки, оборудования и так далее. Недавно разработчики добавили новые функции: скажем, теперь программа может создать расписание съемок, подсчитав время на работу. Также программа напомнит о необходимых разрешениях и мерах безопасности, если в съемках, например, участвуют животные 🐈.

Недавно платформа, основанная выходцами из Беларуси, получила от инвесторов на развитие еще $550 тыс 🤑. Деньги пойдут, в частности, на локализацию программы на испанский, французский и немецкий языки (сейчас программа доступна только на английском). Также в планах у стартапа есть интеграция с крупными маркетплейсами, чтобы съемочная группа могла прямо из Filmustage заказать необходимые вещи 🛍.
🔥9👍3
🐑 Dolly — еще один «бюджетный» конкурент ChatGPT с открытым кодом

На прошлой неделе мы рассказывали про аналог ChatGPT под названием Alpaca, обучение которого стоит в сотни раз дешевле, чем модели OpenAI, за счет использования синтетической информации, сгенерированной с помощью GPT 👛.

👏 Теперь встречайте Dolly — клона Alpaca, названного в честь овечки-клона Долли, задача которого — демократизация доступа к большим языковым моделям. Программисты из компании Databricks говорят, что Dolly можно обучить на небольшом количестве информации, потратив всего $30 и 3 часа работы. При этом вам не потребуется суперкомпьютер за несколько десятков тысяч долларов.

За основу при создании Dolly была взята языковая модель Eleuther 2020 года (в мире ИИ — целая вечность) 👨‍🦳. У Eleuther всего 6 млрд параметров по сравнению со 135 млрд у GPT. Старенькую модель модифицировали с помощью информации, полученной от упомянутой выше Alpaca, и добились способности следовать пользовательским промптам, которой в оригинальной версии не было. Теперь она может работать в режиме чат-бота, генерировать текст и брейнстормить на заданную тему 💪.

Из этого Databricks делают предположение, что крутость того же ChatGPT именно в качестве информации, на которой тренировали чат-бот, а не в технической продвинутости самой модели ℹ️. Ведь Dolly, поясняют разработчики, за очень короткий срок научилась схожим способностям, хотя и не на таком высоком уровне.
🔥11👍21
This media is not supported in your browser
VIEW IN TELEGRAM
В поисковике Bing появились сторис, сгенерированные нейросетью 🫡

Microsoft продолжает прикручивать к обновленному Bing ИИ-обвесы. Теперь настал черед сторис, которые поисковик сгенерирует на основе пользовательского запроса 🔍. Вместо того чтобы читать полотно текста, решили в Microsoft, пользователю удобнее будет получить нужную информацию в сжатом виде и разных форматах: видео, аудио, изображения и текст. ИИ сам не генерирует видео и изображения, а подбирает релевантные примеры на основе алгоритмов 👍.

Сторис, судя по всему, генерируются рандомно: иногда на один и тот же запрос они появляются, иногда — нет 🤔.

❗️Чтобы протестировать функцию, советуем также войти в Bing под учетной записью Microsoft.

Сторис поддерживают запросы на нескольких языках, включая русский 🇷🇺.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
⚡️ Исследование: ChatGPT отберет у вас работу, но не всю

OpenAI, компания OpenResearch и исследователи Университета Пенсильвании выпустили совместную работу. В ней они проанализировали, как большие языковые модели и чат-боты вроде ChatGPT повлияют на американский рынок труда 🛠.

По результатам исследования авторы пришли к выводу, что ChatGPT и ему подобные смогут взять на себя 10% работы у 80% профессий, которые существуют сегодня. У 19% работников чат-бот может отобрать 50% рабочих обязанностей 🫳.

Исследователи также перечислили профессии, которые наиболее «подвержены влиянию» ИИ. Это, в том числе:

✔️Социологи
✔️Переводчики
✔️Писатели
✔️PR-специалисты
✔️Математики
✔️Графические дизайнеры
✔️Бухгалтеры

Авторы уточняют — подверженность влиянию не означает, что эти профессии в недалеком будущем полностью заменят чат-боты. Подразумевается, что работники этих профессий смогут выполнять свои задачи на 50% быстрее, используя искусственный интеллект. Но в теории это, конечно, может означать, что оплата их труда упадет ☹️.

🤖✖️ Есть и профессии, которые искусственный интеллект не затронет вовсе. Это значит, что этим людям можно не переживать за рабочее место, но, с другой стороны, и увеличить эффективность их труда тоже не получится. К таким профессиям, в частности, относятся:

✔️Спортсмены
✔️Каменщики
✔️Операторы сельскохозяйственной техники
✔️Монтажники линий электропередач
✔️Повара в ресторанах
Please open Telegram to view this post
VIEW IN TELEGRAM
⛔️ Илон Маск, Стив Возняк и еще более тысячи человек призвали приостановить разработку новых версий GPT

Соответствующее открытое письмо появилось на сайте Future of Life Institute — некоммерческой организации, которая следит, чтобы технологический прогресс не стал опасностью для жизни людей ⚠️.

В письме подписанты призвали приостановить разработки моделей, более мощных, чем GPT-4, как минимум на полгода. «Можем ли мы позволить машинам наводнить информационные каналы пропагандой и неправдой? Должны ли мы автоматизировать всю работу, включая ту, которая приносит нам удовольствие? Должны ли мы разработать искусственный разум, который сможет превзойти нас численно и интеллектуально, сделать нас ненужными, а потом заменить?», — говорится в письме 😨.

📆 Авторы обращения считают, что разработка продвинутого ИИ должна начинаться только в тот момент, когда «мы будем уверены, что эффект от него будет позитивным, а риски — контролируемы» .

Кроме Маска и Возняка, под письмом подписались гендиректор Stability AI Эмад Мостак, сооснователь Skype Яан Таллинн, исследователи из Оксфорда и MIT, а также несколько бывших и нынешних сотрудников Google. После публикации письма под ним появились, а потом пропали подписи Билла Гейтса, Сэма Альтмана из OpenAI и ученого Яна Лекуна. Лекун у себя в твиттере опроверг, что подписывал письмо.

😏 Future of Life Institute, на сайте которого появилось письмо, в значительной степени финансируется фондом Musk Foundation, основанным Илоном Маском и его братом Кимбалом Маском. Как писало издание Semafor, Маск был в ярости сильно расстроился, когда ChatGPT стал невероятно популярным. Маск был одним из основателей OpenAI, но сейчас частенько критикует компанию.
4🔥4👎2
👨‍🎓 Для обучения ИИ скоро не нужен будет человек

Такой вывод можно сделать из эксперимента Цюрихского университета в Швейцарии. Там выяснили, что ChatGPT, точнее, и что немаловажно, дешевле справится с разметкой данных, которые потом используются для обучения других ИИ-моделей.

👩‍🏫 Чат-бот обработал 25,26 тыс. сэмплов за $70, а аутсорсер за разметку 12,63 тыс. сэмплов просит почти $660. При этом с большинством поставленных исследователями задач ИИ справился лучше человека, а его точность достигала 79%.

Вероятно, в скором будущем ИИ сможет полностью автономно размечать датасеты для обучения, а мы больше не услышим о случаях, подобных недавнему скандалу с участием OpenAI и работников из Кении. Тогда выяснилось, что люди за $2 в час были вынуждены читать описания всякой жести, чтобы ChatGPT потом блокировал подобный контент 👎.

🤖 О том, что модели ИИ скоро фактически будут обучать сами себя без участия человека говорят и новости о чат-ботах Alpaca и Dolly. Первый тренировали на информации, полученной от GPT, а Dolly — на информации, которую сгенерировала уже Aplaca!

🚫 Но не все рады использованию синтетической информации для обучения ИИ. Например, OpenAI в условиях использования своих сервисов прописала запрет на использование сгенерированной информации для обучения конкурентов. Поэтому Google категорически отрицает слова бывших сотрудников, которые утверждают, что чат-бот Bard тренировали на информации, сгенерированной ChatGPT.
🤔4🔥1
🐰 Самый мимимишный голографический ИИ, с которым можно поговорить по душам

Пользовательница твиттера с ником nikki ◕ ᴗ ◕ показала «дядю Кролика» — виртуального персонажа, работающего на ChatGPT.

🖼 Кролик также использует голографический дисплей стоимостью $400 от стартапа Looking Glass, где работает nikki ◕ ᴗ ◕.

Пока непонятно, собираются ли Looking Glass запускать серийное производство девайса, но на страничке проекта можно оставить имейл, чтобы узнавать новости о кролике ⚡️.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍2