D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Media is too big
VIEW IN TELEGRAM
🤖 🖌 Adobe добавил в Photoshop генеративную нейросеть

В программе теперь есть инструмент Generative Fill, который позволяет быстро редактировать изображение с помощью промптов. На каждый промпт генерируется несколько вариантов, из которых можно выбрать. Работает новая система на собственной нейросети Firefly, которую Adobe выпустил этой весной 🔥.

Ключевое отличие Firefly от конкурентов в том, что нейросеть тренировали на стоковых изображениях сервиса Adobe Stock и контенте, который не был защищен копирайтом. Это позволяет авторам использовать результаты работы модели, не боясь получить повестку в суд 🚨.

📆 Generative Fill находится на этапе бета-версии, поэтому пользователи могут столкнуться с багами. Полноценный релиз состоится во второй половине года.

Те, кто уже успел потестировать новый инструмент, в целом хвалят его, но отмечают, что Firefly иногда крайне вольно обращается с инструкциями в текстовых подсказках и выдает что-то свое.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🕹ИИ будет управлять Windows 11

🤝 Microsoft интегрировал в операционную систему Copilot — ИИ-ассистента для взаимодействия с последней на сегодня Windows. Copilot уже используется в офисных приложениях Microsoft и браузере Edge.

Теперь управлять ОС можно будет, запустив из таскбара Copilot, который будет взаимодействовать со всеми приложениями. Ассистента можно будет использовать не только для продвинутого функционала типа саммарайзинга документов, но и базовых задач вроде copy-paste или смены обоев на рабочем столе 🫰.

Разработчики также обещают поддержку плагинов сторонних приложений, которые в марте анонсировали для ChatGPT.

☀️ Пилотный запуск Windows Copilot намечен на июнь, после чего всеми забытого ассистента Cortana, по всей видимости, окончательно отправят на свалку истории 😢. В Microsoft уже намекают, что в будущем системой Copilot можно будет управлять не только текстом, но и голосом.
🔥6👍2
Ритейлер М.Видео показал виртуального амбассадора-сммщицу Эм.Ви ⌨️

Виртуальный аватар будет вести соцсети и блоги компании, записывать обзоры, а также проводить лайвстримы 📹.

Для создания Эм.Ви использовали технологию Motion Capture, за голос аватара будет отвечать неназванный голосовой ИИ, а за тексты, которые она произносит — GPT-подобная языковая модель 😛.

📅 На разработку Эм.Ви у М.Видео ушел почти год. В августе 2022 года компания начала поиск кандидатов на создание цифрового блогера. В качестве референсов тогда назывались актриса Зендея и певица Дора. В ТЗ также использовался образ виртуального блогера Лил Микелы.

В итоге над внешностью Эм.Ви. работала студия ITSALIVE, которая делала клип с 3D-Моргенштерном на Unreal Engine 5 🎤.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Spotify клонирует голоса ведущих подкастов

Синтетические версии хотят использовать в рекламных сообщениях, звучащих в перерывах выпусков. Перед тем как использовать голос, Spotify обещает получить разрешение от его владельца 👍.

🗣 О планах Spotify рассказал основатель сети подкастов The Ringer Билл Симмонс. The Ringer c 2020 года принадлежит Spotify.

🌍 По словам Симмонса, использование ИИ открывает новые рекламные возможности: например, можно записать сразу несколько вариантов рекламного сообщения, чтобы затем таргетировать его на определенную аудиторию. Еще 1 вариант — использовать синтетический голос ведущего для создания рекламы на разных языках.

😌 Симмонс замечтался и предположил, что ИИ также можно натренировать на всех выпусках шоу конкретного ведущего и тогда модель сама сможет не только озвучивать рекламу, но и автономно записывать новые выпуски шоу. Ведущие, вероятно, будут в восторге 🫤.

Официально Spotify не комментировал эти планы. Недавно мы рассказывали о стартапе Adthos, который предлагает за $50 в месяц синтезировать голоса для рекламы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Разработчик Warcraft и Diablo тренирует новую нейросеть на своих играх 🎮

Blizzard Entertainment обучает новую ИИ-модель на ассетах из собственных игр, чтобы быстрее генерировать концепт-арт (персонажей, вещи, пейзажи) для будущих проектов. Нейросеть получила название Blizzard Diffusion 😉.

Таким образом, компания хочет забрать часть рутинной работы у своих художников, чтобы использовать их для более творческих задач 🎨

Несмотря на весь потенциал нейросетей для геймдизайна, Blizzard уже отказывается от использования некоторых моделей. Речь идет, например, об ML-алгоритме, который должен был генерировать 3D-текстуры для виртуальных миров. Оказалось, что настройка модели занимает слишком много времени 🛠.

☝️ Тем не менее в Blizzard планируют в будущем использовать ИИ для генерации голосов, создания NPC, левел-дизайна и написания программного кода.

Над созданием игр с помощью нейросетей уже работают коллеги Blizzard из французской UbiSoft.
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
Media is too big
VIEW IN TELEGRAM
Плагин для Unreal Engine, который сделает из обычных NPC — умных 🧠

🌏 Австралийцы из Replica Studios показали ИИ-плагин для игрового движка, позволяющего создавать NPC, которые реалистично реагируют на окружающий виртуальный мир.

«Статисты» теперь могут обстоятельно общаться друг с другом и игроком (для этого можно использовать микрофон), при этом выглядят не как клонированные болванчики, а как полноценные персонажи — с реалистичной анимацией и липсинком 👄.

Что-то подобное мы недавно видели в фанатском моде для Skyrim ⚔️.

🗣 За создание синтетических голосов отвечает модель собственной разработки Replica, за тексты — GPT, но разработчик может интегрировать и свою языковую модель. Плагин также позволяет для каждого NPC сгенерировать свою «биографию», что должно сделать их еще более правдоподобными.

📆 Демоверсию уже можно попробовать, а полноценная версия должна выйти до конца года.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👏2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Google научил Фламинго делать описания к видео на YouTube 🎞

🦩 Визуальную языковую модель Flamingo научили создавать описания для коротких видео Shorts.

ℹ️ Разработчики объяснили, что в отличие от длинных видео, Shorts сложнее найти через поиск из-за отсутствия нужной информации в описании (метаданных). Так как Shorts обычно смотрят в общей ленте, то авторы не заморачиваются с добавлением информации о ролике.

🫰 Flamingo решает эту проблему, создавая автоматически тексты для миллионов коротких клипов, размещенных на видеохостинге.

🫣 При этом авторы видео эти описания не увидят — метаданные будут использовать «за кулисами» для удобного поиска. Сейчас Flamingo в основном работает с новыми клипами, но постепенно обрабатывает и те, которые уже давно загружены на YouTube.

🔎 Google уже показывал алгоритм, который позволяет искать через поисковую строку информацию внутри видео. А стартап TwelveLabs получил от инвесторов $12 млн на аналогичную разработку.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Маску разрешили протестировать нейрочип на людях, ИИ обманул профессиональных рекламщиков, у приложения TikTok появится чат-бот — и другие важные новости за неделю

Meta* показала речевую модель с открытым кодом, которая может генерировать речь на более чем 1,1 тыс. языков и распознавать более 4 тыс. языков. Модель, в том числе тренировали на Новом Завете в различных переводах;

Intel тоже не спит и анонсировал генеративный ИИ с триллионом параметров. Aurora GenAI будут использовать в научных целях, в частности, для экспериментов по созданию новых материалов. Обеспечивать работу искусственного интеллекта будет суперкомпьютер Aurora c вычислительной мощностью 2 экзафлопса;

ИИ справился с «рекламным тестом Тьюринга». Эксперимент проводили впервые, в рамках маркетинговой конференции BrXnd. 17 маркетинговых экспертов должны были определить, кто автор рекламы — человек или нейросеть. Эксперты угадали правильный вариант только в 57% случаев. Варианты, сгенерированные ИИ, получили от экспертов 2,1 балла из 5,8 возможных, что является результатом выше среднего;

Google анонсировал Product Studio — инструмент на основе ИИ, который позволит продавцам быстро отредактировать фото своего товара, чтобы представить его в наилучшем свете. Product Studio может удалить фон, улучшить качество фотографии и с нуля сгенерировать сцену, куда потом можно добавить товар. Сначала Product Studio будет доступен только продавцам в США;

TikTok тестирует внутри приложения новый чат-бот Tako. Через него пользователь сможет узнать детали о просмотренном видео или попросить сделать подборку видео на определенную тему. Когда чат-бот сделают доступным для всех пользователей, не уточняется;

Стартап Илона Маска Neuralink получил в США разрешение на тестирование своего нейрочипа на человеке. Еще в марте Управление по санитарному надзору США отклонило заявку Neuralink и указало на множественные проблемы. Видимо, за 3 месяца все их удалось исправить. Когда начнутся испытания — неизвестно;

Стартап Neeva, который работал над умным поисковиком по подписке, решил свернуть проект. Разработчики признались, что не смогли заинтересовать проектом пользователей. Теперь компания собирается заняться большими языковыми моделями.

*Организация, запрещенная на территории РФ
👍4
Media is too big
VIEW IN TELEGRAM
Nvidia показала, как будут выглядеть игры будущего 🚀

Компания представила свой вариант технологии создания NPC на основе искусственного интеллекта 🧠.

☁️ Производитель показал двухминутное демо, где игрок взаимодействует с неигровым персонажем. Для создания умных NPC используется несколько ИИ-моделей для генерации голоса, текста и анимации, объединенных в набор под названием Avatar Cloud Engine (ACE). Отдельные инструменты из набора ACE будут использованы в грядущем S.T.A.L.K.E.R. Heart of Chernobyl.

🤔 Пару дней назад мы рассказывали о разработке Replica Studios, которая вполне может стать конкурентом Nvidia: там игрок тоже взаимодействует с умным NPC через микрофон, а анимация не уступает по качеству. Сделано все также на Unreal Engine 5.

📆 Nvidia делает большую ставку на генеративный ИИ и недавно представила последние разработки в этой области. Еще больше обещают показать в августе.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
GoChess — шахматная доска с искусственным интеллектом

🤖 GoChess представляет из себя фиджитал-версию классической игры, где игрок может сразиться с искусственным интеллектом на физической шахматной доске. ИИ делает ход, а роботизированная доска сама передвигает фигуры. ИИ постоянно адаптируется под уровень игры пользователя, чтобы тот никогда не почувствовал, что ему слишком легко выиграть.

В GoChess можно играть и с другим игроком через интернет. Ход игры можно отслеживать через приложение 📱.

Еще GoChess можно использовать для обучения игре — в таком режиме доска будет подсвечивать возможные варианты хода. Если вам совсем лень, то свои фигуры можно двигать через голосовое управление 🗣.

Разработчик Particula собирает деньги на GoChess через Kickstarter. На момент написания текста на умную шахматную доску уже собрали почти $950 тыс., хотя Particula просили только $20 тыс 🤑.

До этого компания уже выпустила продвинутую версию кубика Рубика (GoCube) и игральные кости, совместимые с планшетом (GoDice). GoChess будет стоить $279.
👍6
🔫 Guanaco — новый убийца ChatGPT с открытым кодом

Исследователи из Вашингтонского университета показали Guanaco — очередной чат-бот, названный в честь животного из семейства верблюдовых, и построенный на языковой модели LLaMA 🐪.

🔎 Создатели утверждают, что Guanaco практически не уступает по производительности ChatGPT, но обучается всего за день. Все благодаря новому методу файн-тюнинга языковой модели под названием QLoRA — он позволяет снизить количество требуемой GPU-памяти с 780 Гб до 48 Гб для модели с 65 млрд параметров (для самой простой версии Guanaco достаточно 5 Гб).

⚰️ Со стороны может сложиться впечатление, что дорогие в обучении модели доживают последние дни и будущее — за Guanaco, Alpaca и прочими Dolly, которые обучают за копейки на информации, сгенерированной GPT.

👎 С этим в корне не согласны в Калифорнийском университете, где провели исследование, чтобы сравнить возможности моделей типа Alpaca и GPT-4. Сначала они пришли к тому же выводу — модели с открытым кодом при правильном обучении сравнимы по возможностям с GPT. Но после дополнительных тестов исследователи изменили свое мнение: Dolly и им подобные способны только имитировать «дорогие» модели. Грубо говоря, Dolly может убедительно справиться с задачей, для которой уже видела пример решения, но в остальных случаях будет серьезно проигрывать продвинутым моделям.

Так что, миллионы на обучение GPT все-таки тратят не впустую.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Google выпустил модель, которая может синтезировать диалоги 👨‍🦰💬 👽

SoundStorm отличается высоким качеством/консистентностью генераций и скоростью работы (создание 30-секундного аудио занимает 0,5 секунды) и дает высокую степень контроля над синтезированным фрагментом 🕹.

🗣 Например, модель позволяет контролировать, кто из «участников» диалога, какой текст произносит, а также генерировать аудио, используя 3-секундный аудиопромпт или без него.

▶️ С помощью SoundStorm любое текстовое интервью можно превратить в подкаст.

🐾 Авторы модели признают, что SoundStorm могут эффективно использовать мошенники, в том числе для того, чтобы обходить биометрическую защиту. Разработчики отмечают, что специальное ПО может определить синтетическое аудио, сгенерированное SoundStorm, но что делать, если под рукой такой программы нет, не уточняют.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥621
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ Google Messenger научился писать сообщения за пользователя

В мессенджере появилась функция Magic Compose, которая с помощью ИИ генерирурет несколько вариантов сообщения.

На старте Magic Compose может создать сообщения в семи стилях, в том числе «деловом» (Formal), «на расслабоне» (Chill) и «в духе Шекспира» (Shakespeare) ✏️.

Функция находится на этапе бета-версии и доступна ограниченному количеству пользователей. Кроме того, если вы печетесь о своей безопасности, то Magic Compose, скорее всего, не для вас: чтобы сгенерировать подходящее сообщение, мессенджер отсылает на сервер Google последние 20 сообщений пользователя. Вместе со всеми ссылками, но без прикрепленных файлов 😱.

Разработчики обещают, что потом сообщения безвозвратно удаляют с сервера 😮‍💨.

Недавно похожий на Magic Compose функционал показал Microsoft в виртуальной клавиатуре SwiftKey.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3🔥1
⚠️ Глава OpenAI подписал заявление об угрозе ИИ для человечества

В коротком заявлении говорится: «Снизить риски истребления человечества искусственным интеллектом, должно стать глобальным приоритетом, сравнимым с другими проблемами, затрагивающими все общество, такими как пандемия и ядерная война» ☝️.

Кроме Сэма Альтман его подписали, в частности, глава Google DeepMind Демис Хассабис, а также ИИ-исследователи и лауреаты Премии Тьюринга Джеффри Хинтон и Иошуа Бенджио.

Хинтон недавно высказывал свои опасения по поводу ИИ, после того как уволился из Google после 10 лет работы в компании. Еще один обладатель премии Тьюринга за исследования в сфере ИИ — Ян Лекун — текст не подписал 🤷‍♀️.

В конце марта было опубликовано письмо, подписанное в том числе Илоном Маском и Стивом Возняком, в котором предлагалось приостановить разработку новых ИИ-моделей минимум на полгода. За этот период подписанты предлагали оценить последствия и возможные риски использования моделей более мощных, чем уже вышедшая GPT-4.

🥊 У Альтмана и Маска уже давно непростые отношения, но оба активно выступают за необходимость государственного регулировании ИИ. Правда, письма все равно подписали разные.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍1👎1
🤖 На ЦИПР обсудили будущее метавселенных, NFT и нейросетей

31 мая в рамках конференции прошла сессия на тему «Метавселенная, NFT и ChatGPT. Реальность или только разговоры?».

👥 В ней приняли участие руководитель Цифровой лаборатории Газпром-медиа Эдуард Маас, а также руководитель направления «VR/AR, технологии геймификации» ИТ-кластера «Сколково» Алексей Каленчук, художник Миша Most, основатель Metaverse-агентства Maff Алексей Помыканов, руководитель Sber AR/VR Lab Максим Козлов, глава направления NFT «Вконтакте» Иван Бойченко, гендиректор телеканала RTVI Ольга Пивень и менеджер по продажам «Студии Артемия Лебедева» Никита Деменков.

☝️ Спикеры обсудили действительно ли «мертвы» метавселенные и как им могут помочь генеративные нейросети; зачем запускать NFT-проекты в условиях сокращения рынка; как продюсировать проекты с помощью AGC (AI Generated Content) и почему ИИ не отберет работу у людей.

▶️ Полную версию сессии можно посмотреть здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩4👍1🥰1
🤖 Эдуард Маас: «Основной фокус у нас сейчас на AIGC – контенте, генерируемом искусственным интеллектом»

Контент, создаваемый искусственным интеллектом, аватаризацию и web 3.0 «Газпром-Медиа Холдинг» определил для себя как ключевые зоны технологического развития медиа на ближайшие 3-5 лет. Об этом на открывшейся вчера в Нижнем Новгороде конференции ЦИПР рассказал руководитель Цифровой лаборатории ГПМХ Эдуард Маас.

💬 «Пожалуй, основной фокус из этих трех направлений у нас сейчас на AIGC – контенте, генерируемом искусственным интеллектом. Мы не просто смотрим на эти технологии, мы активно применяем их внутри. У нас сейчас не только ChatGPT, а целый ансамбль моделей работает – их порядка пятнадцати. Есть open source, есть коммерческие, есть наши собственные. В работе больше десяти различных форматов контента - краткие пересказы, эссе, генерация нового контента. Мы смотрим на AIGC как на инструмент решения двух основных задач. Первая – монетизация, возможность вдохнуть новую жизнь в архивный контент. Вторая задача – оптимизация производственного процесса»,

— Эдуард Маас, руководитель Цифровой лаборатории ГПМХ

@GPMofficial
5
This media is not supported in your browser
VIEW IN TELEGRAM
🫡 У Nvidia появился Нейроланджело для генерации 3D из 2D

Модель Neuralangelo может генерировать детализированные 3D-сцены из 2D — например, из видео, снятого на iPhone. Ассеты потом можно выгрузить для дальнейшего редактирования ✂️.

Аналоги Neuralangelo мы видели не один раз, но Nvidia напирает именно на детализированность — модель переносит в 3D даже самые сложные узоры и текстуры физических предметов 🗿.

🚚 На видео выше показано как алгоритм одинаково качественно справляется с мраморной статуей Давида работы Микеланджело и обычным грузовиком. В зависимости от сложности предмета на создание 3D уходит около двух часов.

📆 Полноценная презентация нейросети состоится в конце июня на конференции в Ванкувере, посвященной компьютерному зрению и распознаванию объектов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤩2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 ИИ-приложение, которое легко замиксует Михаила Круга с Daft Punk

🎵 Mixboard разработали в Технологическом институте Джорджии в США. С помощью iOS-программы пользователи без музыкального образования могут создать «трек своей мечты», обещают создатели.

🎙 Чтобы сделать мэшап можно выбрать до четырех треков из библиотеки Spotify или Mixboard. Песни нужно будет распределить по категориям «вокал», «бас», «ударные», «аккорды», чтобы ИИ знал, из какого трека, какую часть взять.

🗣 Алгоритм сам выберет нужный темп, тональность и отредактирует отдельные семплы, чтобы потом объединить их в трек. ИИ Mixboard обучали на музыкальных библиотеках с открытым исходным кодом.

🆘 Разработчики пока не выпускают приложение в открытый доступ, в том числе из-за опасений связанных с копирайтом.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥101
This media is not supported in your browser
VIEW IN TELEGRAM
🕹 Пользователь твиттера превратил себя в AR-персонажа

🛠 I▲N CURTIS использовал iOS-приложение NeRF-модели от LumaAI, чтобы создать 3D-модель самого себя и перенести ее в виртуальный мир. Дополнительно он работал с Blender и WebAR-сервисом 8th Wall.

🎮 У разработчика есть еще несколько AR-проектов, один из них — AR-тетрис с прикрученной к нему GPT-4.
🔥3🤔1
Nvidia ненадолго стала триллионером, «Точка» следит за эмоциями клиентов, Baidu инвестирует в генеративные нейросети — и другие важные новости за неделю

Nvidia ненадолго попала в клуб компаний с рыночной капитализацией $1 трлн. Благодаря буму нейросетей, которые требуют все больше и больше GPU, акции компании 26 мая взлетели в цене на 26%, а капитализаций выросла сразу на $200 млрд, к 31 мая достигнув триллиона долларов. Правда, уже 1 июня ценные бумаги Nvidia подешевели почти на 6%, и компания выбыла из престижного клуба;

Платные подписчики Snapchat теперь могут отправить чат-боту My AI внутри приложения любое фото, а в ответ получить его генеративную версию или, например, рекомендацию с рецептом, если на фото запечатлен список продуктов;

Банк «Точка» научил нейросеть распознавать эмоции клиентов во время переписки с сотрудником банка в чате. ML-модель оценивает состояние на протяжении всего разговора по трем категориям: негативная, позитивная, нейтральная. Это должно помочь контролировать качество работы сотрудников;

Китайский бигтех Baidu анонсировал запуск венчурного фонда, который будет инвестировать в стартапы, разрабатывающие генеративные нейросети. Объем фонда составит $145 млн;

Meta* показала новую версию MR-шлема Quest. Quest 3 отличается от предшественников более мощным процессором, новыми камерами и поддержкой контроллеров Touch Pro. В продаже — осенью, по цене $499.

*Организация, запрещенная на территории РФ
👍1