D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🙉 Universal Music не хочет, чтобы люди слушали сгенерированную ИИ музыку

Universal Music Group (UMG), которая контролирует около трети мирового музыкального рынка, считает, что Spotify, Apple Music и другие, должны блокировать доступ к их музыкальному каталогу для разработчиков ИИ-моделей 🔞.

Объясняют необходимость такого запрета тем, что нейросетки незаконно обучаются на «настоящих» песнях, а потом генерируют треки, похожие на произведения известных исполнителей. Как технически могла бы выглядеть такая блокировка, не уточняется.

🏴‍☠️ Осенью 2022 года с похожей инициативой выступала Американская ассоциация звукозаписывающих компаний (RIAA), которая прямо называла использование защищенной копирайтом музыки для обучения ИИ-моделей пиратством.

Нельзя сказать, что UMG так уж сильно преувеличивает проблему: мы, например, писали про то, как Дэвид Гетта с помощью нейросети добавил в свой трек вокал Эминема. UMG выступает издателем музыки рэпера и недавно заставила удалить с YouTube трек музыканта, полностью созданный с помощью нейросетей 🎧.

В общем, к войне фотографов и художников против ИИ теперь официально присоединился музыкальный бизнес 🎶.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3😱3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Расширение для браузера, которое пользуется интернетом не хуже человека ⌨️ 🌐

HyperWrite работает вместе с Chrome и изначально позиционировался как ассистент для написания текстов различных форматов: постов в блоги, имейлов, статей и т.д. ✏️.

🍕 В новой версии расширения, которая пока доступна только в тестовом режиме, HyperWrite научился серфить в интернете и может, например, самостоятельно заказать пиццу или купить авиабилеты по текстовой подсказке.

То есть теперь HyperWrite становится на одну полку с проектами вроде AutoGPT и BabyAGI — ИИ-агентов, которые могут самостоятельно создавать для себя текстовые подсказки для решения поставленной пользователем задачи 💪.

Создатели расширения не раскрывают, на какой ИИ-модели работает HyperWrite, но говорят, что она «похожа на ChatGPT».

Публично обновленное расширение обещают выпустить, когда решат все вопросы с безопасностью. Например, как доверить приложению данные банковской карты или сделать так, чтобы программа не купила что-нибудь без вашего ведома 🤑.

Если хотите потестировать ассистента до релиза, то можно записаться здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52
🤦‍♂️ Forbes назвал самые перспективные ИИ-компании

В список попали 50 компаний из самых разных областей: медицина, безопасность, продажи и даже лесоводство. Полный список можно посмотреть здесь.

💲 Из всех участников только четыре получили от инвесторов более миллиарда долларов: OpenAI, разрабатывающая оборонное ПО Anduril Industries, Anthropic и Databricks. Есть также компании, которые пока не получили от инвесторов ничего — это Midjourney и Surge AI. Последняя специализируется на разметке данных. Midjourney пока даже не собирается привлекать инвестиции.

Forbes отдельно выделили четырех участников списка:

🌐 Adept Про них мы уже писали в тексте про темных лошадок ИИ-рынка. Стартап разрабатывает браузерное расширение для автоматизации выполнения различных заданий.

💊 Insitro Этот стартап использует ML-алгоритмы для анализа человеческих генов и поиска новых лекарств.

🍿 Runway Эти люди вам должны быть хорошо знакомы. Сейчас это, наверное, самый перспективный ИИ-стартап, который разрабатывает инструменты для работы с видео и изображениями. Их ПО использовали при создании некоторых спецэффектов для «Все везде и сразу» — лучшего фильма прошлого года по версии «Оскара».

📹 Synthesia Стартап, который разрабатывает решения для создания синтетического видео с участием цифровых аватаров, которые могут говорить на 120 языках. У компании уже 35 тыс. клиентов, в том числе очень крупных, поэтому немного странно видеть ее в списке перспективных.
Please open Telegram to view this post
VIEW IN TELEGRAM
43👍2
Маск скупает GPU, OpenAI платит за поиск уязвимостей, Stable Diffusion выросла до размера XL — и другие важные новости за неделю

Илон Маск все еще пытается реанимировать Twitter и даже затеял какой-то ИИ-проект для соцсети. Для этих целей Маск недавно закупил 10 тыс. GPU и переименовал Twitter Inc. в X Corp;

Глава OpenAI Сэм Альтман начал мировое турне с целью пролоббировать использование сервисов компании. Альтман, в частности, заехал в Японию. Там глава правительства страны Фумио Кисида пообещал ему начать использовать ChatGPT, как только к безопасности чат-бота будет не так много вопросов. Всего Альтман посетит 16 стран;

OpenAI запустил Bug Bounty-программу для ChatGPT. Любой нашедший уязвимости в работе чат бота может получить от $200 до $20 тыс. За взлом сервиса никаких наград не предусмотрено;

Разработчики Stable Diffusion выпустили новую версию популярной нейросетки. Называется Stable Diffusion XL, где XL означает увеличенное количество параметров модели — 2,3 млрд против 900 млн у обычной версии. XL-версию можно попробовать через API или платный сервис DreamStudio;

Прошло пару недель, а стартап Databricks уже представил коммерческую версию своей языковой модели с открытым кодом Dolly (подробнее о ней читайте здесь). Dolly 2.0 все еще полностью бесплатная, а пользователи могут продолжить обучать ее на собственных данных;

Meta* опубликовала исходный код модели Animated Drawings, которая позволяет анимировать любые стремные каракули;

Alibaba собирается добавить своего конкурента ChatGPT по имени Tongyi Qianwen во все свои сервисы. Первыми станут корпоративная платформа DingTalk и платформа для взаимодействия с умными устройства Tmall Genie.

*Организация, запрещенная на территории РФ
🔥7
Что за AutoGPT и почему все о нем говорят 💬

AutoGPT — это на данный момент, пожалуй, самый популярный представитель экспериментальных сервисов, которые называют автономными ИИ-агентами. Идея таких сервисов заключается в том, что они могут без участия человека выполнить поставленную задачу, разработав для себя план действий. Если в ходе работы сервис находит ошибку, то он сам исправляет ее, корректируя свои действия ✔️.

Возможность оставить чат-бот без надзора так взбудоражила общественность, что про AutoGPT написали даже Cosmopolitan и Euro News 😱.

AutoGPT придумал независимый разработчик Торан Брюс Ричардс aka Significant Gravitas. Сервис работает на GPT-4 и для выполнения задач, по сути, раз за разом анализирует информацию, сгенерированную языковой моделью и корректируя ее по необходимости.

Ричардс говорит, что его цель — превратить AutoGPT в универсальный искусственный интеллект (AGI), который сможет выполнять самые разные задачи, для которых он изначально не был запрограммирован: купить ботинки, проанализировав перед этим отзывы на маркетплейсах; сделать пост для соцсети и запланировать публикацию; написать бизнес-план — что угодно 🤹.

🚼 Еще один популярный проект на ту же тему, но с уклоном в бизнес — BabyAGI, созданный инвестором Йохей Накадзимой. Вообще, больше всех появлению ИИ-агентов обрадовались розничные инвесторы, которые надеются с помощью них оптимизировать свою работу.

У обоих сервисов есть веб-версии: AutoGPT, BabyAGI 🫡.

AutoGPT и BabyAGI (а также похожий на них HyperWrite, о котором мы рассказывали пару дней назад) — пока только эксперименты по той же причине, по которой ChatGPT нельзя использовать как надежный источник информации — алгоритмы допускают слишком много ошибок, чтобы доверять им серьезные задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71👍1
Как превратить пространство вокруг себя в интерактивное хранилище запросов к ChatGPT 🗄

Основатель проекта Softspace Йилиу Шен-Бюрке у себя в твиттере показал, как с помощью AR/VR-технологий упростить взаимодействие с ChatGPT.

Суть «Прототипа 06» в том, что он предлагает отойти от уже привычного формата чат-бота и вместо этого использовать интерактивную карту в AR 🗺.

Например, пользователя интересует, что такое AGI — он вводит соответствующий запрос, получает на него ответ, а также несколько смежных тем, которые могут быть ему интересны. Эти дополнительные темы отображаются в AR в виде облака запросов, с каждым из которых можно взаимодействовать ☁️.

ИИ в данном случае отвечает за то, чтобы предлагаемая информация была максимально релевантна к первоначальному запросу.

По ходу изучения темы, пользователь получает ту самую интерактивную карту из интересующей его информации. К уже изученным темам можно возвращаться, а те, которые оказались неинтересны, можно с AR-карты удалить 🗑.

Проект можно попробовать самому, если есть Quest VR.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
«Теперь мне не нужны друзья»: американец натренировал ИИ-модель на переписке со своими знакомыми за 7 лет 📆

Data Scientist Иззи Миллер решил заменить алгоритмом вещь, которая для него, по его собственным словам, «спасательный круг, источник комфорта и точка объединения». Речь, конечно же, об общем чате с друзьями из колледжа 💬.

Для этого он выгрузил из чата с шестью участниками полмиллиона сообщений, накопившихся за 7 лет переписки, и натренировал на них модель LLaMA. Затем он создал клон интерфейса iMessage, чтобы переписка в синтетическом чате выглядела убедительнее 👍.

По словам Миллера, особенно его поразило то, что ИИ не просто выучил, кто как пишет в чате, но и кто где живет, с кем встречается, чем увлекается и т. д.

😐 Конечно, алгоритм не идеален и допускает ошибки. Например, ИИ иногда «думает», что все участники чата до сих пор учатся в колледже — все потому, что именно в тот период переписка велась особенно активно.

Во всех подробностях почитать о том, как создавался чат Robo Boys можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🤔2👍1
Media is too big
VIEW IN TELEGRAM
📷 NeRF, который заменит фотоальбом

В Google усовершенствовали существующие NeRF-модели и добились очень крутого результата, который можно оценить выше. Да, это не видео с пролетом дрона, а полностью синтетическая 3D-сцена, созданная из фотоснимков 🦸.

Если кратко, то исследователи в компании смогли объединить достоинства Instant-моделей, которые могут создать 3D-изображение в несколько раз быстрее стандартных NeRF, со своим Mip-NeRF алгоритмом. Mip-NeRF может создавать очень детализированные синтетические панорамы, но на это у модели уходит несколько часов 🏃‍♀️.

💸 Получившуюся модель назвали Zip-NeRF. Она сохраняет качество Mip-NeRF, но работает при этом в 22 раза быстрее. Препятствием для широкого использования подобных моделей остается требовательность к ресурсам. Для работы Zip-NeRF понадобится 8 Nvidia Tesla V100-SXM2-16 GB GPU, которые стоят около ₽150 тыс. за штуку.

Коллеги уже фантазируют, что именно так будут выглядеть в будущем фотоальбомы — как бесшовные 3D-сцены, в которые можно будет погрузиться с помощью VR, чтобы поностальгировать 😌.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12🤯2
Media is too big
VIEW IN TELEGRAM
Exit Suit — экзоскелет для VR, который можно напечатать 🕴 🖨

Костюм, придуманный «VR-энтузиастом» Вилли Уинклером, состоит из нескольких haptic-датчиков, расположенных по всему телу и соединенных с VR-шлемом. Exit Suit реагирует на события, происходящие в VR, передавая сигнал на соответствующую часть тела 🦵.

Экзоскелет состоит из модулей, поэтому его части легко заменяются, а костюм можно быстро кастомизировать 🧩. Еще один плюс — Exit Suit можно распечатать на 3D-принтере.

🛠 Проект пока находится на стадии разработки, поэтому Уинклер не говорит, во сколько может обойтись самостоятельная сборка костюма. Кроме того, у Exit Suit есть некоторые технические ограничения, например, на действия, которые в нем можно выполнять.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
Amazon поручил искусственному интеллекту следить за громкостью в сериалах и фильмах 📢

В стриминг-сервисе Amazon Prime появилась функция Dialogue Boost, которая автоматически увеличивает громкость диалогов по сравнению с остальными звуками в сериалах и фильмах 🗣.

ИИ-алгоритм целиком анализирует звуковую дорожку, находит в ней диалоги и точечно увеличивает только их громкость. Пользователь может выбрать интенсивность Dialogue Boost, для этого доступны 3 режима — High, Medium и Low 🫡.

Как утверждает Amazon, до этого момента такая функция была доступна только владельцам High-End-устройств, а теперь — любому подписчику стриминг-сервиса. Сейчас Dialogue Boost доступен для сотни тайтлов в каталоге сервиса, список обещают постепенно пополнять ☝️.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT для разработчиков игр 🎮

Так называют набор инструментов на основе генеративного ИИ Buildbox AI его разработчики.

Buildbox AI встроен в nocode-платформу Buildbox и позволяет по текстовому запросу создавать ассеты, чтобы затем использовать их в играх 💬.

Сгенерированные объекты совместимы с самыми популярными игровыми движками Unity и Unreal.

Пользователи Buildbox AI выступают еще и в роли тестеров платформы: генерируя ассеты, они одновременно тренируют ИИ-модель 🏋️‍♀️.

У платформы есть бесплатная версия, но ИИ доступен только в платных версиях — стоимость начинается от $45 в год.

🫴 Интересно, что разработчики Buildbox зарабатывают не только на подписке, но и получая фиксированные проценты от выручки, которую зарабатывает автор игры.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Reddit тоже против ИИ, нейрокартинка выиграла престижный фотоконкурс, со стриминг-сервисов удалили несуществующую песню Дрейка и The Weeknd — и другие важные новости за неделю

Фотограф Борис Эльдагсен отправил свой снимок на престижный конкурс Sony World Photography, а когда выиграл — отказался от приза и признался, что фотографию сгенерировала нейросеть. По словам Эльдагсена, он специально проверял жюри конкурса;

Samsung и LG лоббируют замену проекторов в кинотеатрах на LED-экраны. Такие экраны ярче проекторов и поддерживают фишки вроде HDR, но при этом гораздо дороже и энергозатратнее;

Главный интернет-форум Reddit больше не хочет, чтобы ИИ-модели тренировались на сообщениях его пользователей бесплатно. Владельцы отправили API сайта под пейволл — теперь тем, кому нужен особый доступ к контенту сайта (то есть разработчикам ИИ-алгоритмов), придется за это заплатить. Цены пока не названы;

Музыкальный бизнес продолжает воевать с нейросетями. Теперь по требованию мейджоров со Spotify и Apple Music удалили совместный трек Дрейка и The Weeknd, полностью созданный искусственным интеллектом. В TikTok Heart On My Sleeve успел набрать больше 13 млн прослушиваний;

Яндекс в мае этого года откроет в Москве центр для тестирования складских роботов собственного производства. В перспективе Яндекс хочет продавать их другим компаниям и на экспорт;

Разработчики нейросети Stable Diffusion представили свою первую языковую модель с открытым кодом. Бесплатная модель доступна в вариантах с 3, 7, 15, 65 млрд параметров;

Google объединил все подразделения, которые занимаются ИИ, в одно и назвал его Google DeepMind. Объясняется это необходимостью повысить эффективность работы команд в попытке угнаться за Microsoft.
👍11
OpenAI тратит около $1 миллиона в день на работу ChatGPT 😱

К такому выводу пришли аналитики из фирмы SemiAnalysis, исходя из приблизительной стоимости серверов, которые арендует стартап.

По словам главного аналитика SemiAnalysis Дилана Патела, работа ChatGPT на языковой модели GPT-3 стоила OpenAI около $700 тыс. в день. Соответственно, новейшая GPT-4 обходится компании еще дороже 💸.

Обучение такой модели, как GPT-4, стоит десятки миллионов долларов, а значит, поддержание модели в рабочем состоянии может обходиться в сопоставимую сумму каждую неделю.

🛠 Для того чтобы сократить огромные затраты, Microsoft собирается разрабатывать собственные чипы, заточенные под работу ИИ-моделей. Так компания сможет оставаться независимой от компаний вроде Nvidia, не опасаясь дефицита полупроводников из-за растущего спроса. Чипы должны показать в начале следующего года.

🧠 Эксперты связывают серьезное удешевление разработки ИИ-моделей с дальнейшим развитием нейроморфных вычислений — компьютерной архитектуры, построенной по аналогии с работой человеческого мозга. Но на это может уйти еще как минимум несколько лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱7😁1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-ассистент, который записывает все, что делает пользователь ✍️

Rewind запоминает, что пользователь делает на своем компьютере (пока программа работает только на Mac), чтобы при необходимости напомнить ему 🗒.

Недавно ассистент получил поддержку GPT-4 и теперь с ними можно общаться в режиме чат-бота. Достаточно спросить: «Что я вчера заказывал на Amazon?» или «Откуда я знаю этого человека?», и Rewind быстренько все напомнит 🧠.

👮‍♂️ Учтите, что Rewind запомнит не только вашу историю браузера: программа запишет ваш созвон в Zoom, вашу переписку в мессенджере. И да — какие запросы вы вбивали в поисковик тоже запишет (к отдельным приложениям Rewind можно ограничить доступ).

Из всего этого следует логичный вопрос: что будет, если ко всей этой информации доступ получит злоумышленник? В Rewind на это отвечают, что всю конфиденциальную информацию программа хранит локально, а в облако попадают только обезличенные данные и только текстового формата. Сами решайте, достаточно ли для вас такой защиты 🤔.

У программы есть несколько вариантов подписки, включая бесплатную, которые отличаются количеством «перемоток», которые вам дадут сделать за месяц, а также приоритетным доступом к новым функциям.
🤔41👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Супермодель превратилась в метачеловека 💃

Мы уже рассказывали про технологию MetaHuman от разработчиков из Epic Games, которая на основе видео, снятого даже на айфон, может в реальном времени создать реалистичную лицевую анимацию.

👗 Спустя несколько недель для MetaHuman нашлось практическое применение: чешская супермодель Ева Герцигова согласилась создать свой цифровой аватар с помощью программы. Потом его можно будет использовать для виртуальных модных показов.

🎦 Снимали Герцигову, конечно же, не на 1 айфон — для создания аватара использовали сразу 70 камер. Пригодилась и продвинутая mocap-система Vicon, разработанная американской компанией Cemtrex.

До Герциговой MetaHuman тестировали на баскетболисте Луке Дончиче 🏀.
This media is not supported in your browser
VIEW IN TELEGRAM
Video2Video-нейросеть Gen-1 — уже на вашем айфоне 🤳

Пока доступ к Gen-2 получают только избранные, можно потестировать предыдущую версию модели — зато сразу на смартфоне через приложение RunwayML (пока только на iOS) 🥳.

✂️ 🎞 Редактировать свои видео в приложении можно, используя готовые фильтры, собственные изображения или с помощью текстовых подсказок.

Бесплатная версия ограничена 525 кредитами — 1 секунда отредактированного видео стоит 14 кредитов. Докупать кредиты в бесплатной версии нельзя. Gen-1 редактирует первые 5 секунд загруженного ролика, сам процесс занимает 2-3 минуты .

📅 Если хотите развлекаться с Gen-1 дальше, то придется купить месячную или годовую подписку. Они отличаются количеством устройств для установки, объемом облачного хранилища и форматами, которые доступны для экспорта файлов. Стоимость подписки на месяц начинается от ₽1,3 тыс., на год — от ₽13 тыс.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
This media is not supported in your browser
VIEW IN TELEGRAM
Sci-Fi-фильм, полностью сгенерированный ИИ

🧩 Пользователь твиттера TomLikesRobots показал 40-секундный мини-фильм, за каждый элемент которого отвечала отдельная нейросеть:

— Визуальный ряд создан с помощью Text2Video-модели Gen-2;

— Сценарий написал ChatGPT;

— аудио синтезировал алгоритм от ElevenLabs (результат вы пока не услышите — автор пообещал добавить его позже).

📝 Сюжет, который явно вдохновлен классикой вроде «Чужого», рассказывает о команде космонавтов, которые во время выполнения миссии получают сигнал с неизвестного корабля. На корабле они находят загадочную женщину и забирают ее с собой. Естественно, после этого с героями начинают происходить странные вещи 🤯.

🍿 Посмотрев результат, можно согласиться с режиссером фильмов Marvel Джо Руссо, который прогнозирует, что ИИ научится снимать 1,5-часовые фильмы в течение двух лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
«Как семья, но больше сыра»: посмотрите нейрорекламу выдуманной пиццерии 🍕

Художник под ником Pizza Later потратил 3 часа жизни, чтобы создать с помощью нейросетей рекламу выдуманной сети пиццерий Pepperoni Hug Spot.

Получилось, пожалуй, даже криповее, чем видео с Уиллом Смитом, поедающим спагетти 😳.

🛠 Pizza Later использовал ChatGPT (сценарий), Midjourney (иллюстрации), Gen-2 (видео), сервис Eleven Labs (голос) и Soundraw AI (музыка). Все вместе автор сводил с помощью Adobe After Effects.

👕 Если ролик привел вас в восторг, то можно купить мерч с логотипом Pepperoni Hug Spot.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52