D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
👕 Разработчики нового Assassin’s Creed выпустят майку, которая добавит реалистичности прохождению

😱 Ubisoft совместно с компанией OWO разработали хаптическую майку, которая передает ощущения главного героя во время схваток с противниками (в том числе, когда персонаж пропускает удары врагов).

🎮 Аксессуар будет совместим со всеми системами, на которых выйдет новая часть долгоиграющей франшизы. Правда, желающим повысить иммерсивность геймплея до небес, придется приобрести специальную версию игры, которая будет в несколько раз дороже стандартной.

💸 Точные цены пока не называют, но отдельно Haptic Vest от OWO стоит около $500.

Assassin’s Creed Mirage появится в продаже 12 октября.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
Кристофер Нолан сравнил ИИ с изобретением атомной бомбы 💣

👨‍🔬 Нолан сравнил Кремниевую долину с лабораторией в Нью-Мексико, где разрабатывались первые образцы ядерного оружия, а программистов — с участниками Манхэттенского проекта.

🎥 У режиссера через пару дней выходит новый фильм «Оппенгеймер» — байопик Роберта Оппенгеймера, которого называют «отцом атомной бомбы».

🤔 По словам режиссера, он много общается с главными людьми в сфере ИИ, те сейчас много думают над ответственностью, которую они несут за непредвиденные последствия от использования их разработок. Оппенгеймер по началу был уверен, что атомное оружие поможет сохранить мир на Земле, а не наоборот.

Нолан сокрушается, что существуют и те, кто не хотят брать на себя ответственность за результаты работы их алгоритмов. И это, считает режиссер, может привести к «ужасающим» последствиям 😱.

⚠️ Нолан не первый, кто говорит об опасности стремительного развития искусственного интеллекта. ИИ уже сравнивали с ядерной бомбой исследователи из Оксфордского университета. «Крестный отец» искусственного интеллекта предупреждал о возможном восстании машин. И даже глава OpenAI подписал письмо с предупреждением об опасности алгоритмов для человечества.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2👎1
Media is too big
VIEW IN TELEGRAM
Нейросеть, которая научит танцевать любого 🕺

DisCo сгенерирует реалистичную анимацию танцев по 1 референс-фотке.

🔩 Разработчики говорят, что при создании модели они ставили перед собой 3 задачи:

1️⃣ Генерация должна быть максимально приближена к референс-изображению (то есть человек на фото, окружающая обстановка не должны меняться);

2️⃣ Модель должна адекватно работать с новой информацией, с которой до этого ни разу не встречалась (например, позы людей на референс-фотографиях);

3️⃣ DisCo должна уметь в композициональность. Грубо говоря, если человек в генерации был с 1-й фотографии, его поза — из 2-й, а фон — из 3-й, то для нейронки это не должно стать проблемой.

Результат можно посмотреть в клипе выше. Код тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
GPT-4 стала глупее за несколько месяцев работы. Или нет? 🤪

Пользователи уже некоторое время назад заметили, что в последнее время языковая модель от OpenAI стала хуже справляться с некоторыми заданиями. Теперь этому, вроде бы, есть конкретные подтверждения.

📑 Исследователи из Стэнфорда и Калифорнийского университета выпустили работу, где сравнили результаты выполнения LLM определенных задач в марте и июне этого года. В некоторых случаях точность упала на десятки процентов. Например, процент решенных задач, связанных с генерацией кода, снизился с 52% в марте до 10% в июне.

🧮 С решением математических задач языковая модель стала справляться даже хуже. В марте GPT корректно решала 97,6% задач, а в июне — всего 2,4%. Языковая модель не просто давала неправильные ответы, но и разучилась пошагово разъяснять, как она к ним пришла.

Интересно, что предыдущая версия GPT — 3,5 — с аналогичными задачами стала справляться чуть лучше.

🤔 Некоторые предполагают, что OpenAI ради экономии и повышения скорости работы разбили GPT-4 на несколько моделей поменьше и распределяют запросы пользователей между ними. Сами OpenAI сначала утверждали, что пользователям просто показалось, но потом пообещали разобраться.

Правда, у некоторых возникли вопросы к самой методологии, по которой проводили исследование. Например, исследователи задали GPT 500 задач, где попросили модель определить простое число перед ней или нет. При этом во всех 500 задачах были заданы простые числа. Это могло привести к тому, что конкретно в этом случае алгоритм модели начал сбоить. Но считать на этом основании, что модель поглупела, нельзя. И таких вопросов к авторам работы не один. Подробнее об этом можно почитать тут и тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
В Австралии подростка перепутали с ИИ-генерацией, Tesla хочет собственный суперкомпьютер, Apple разрабатывает свой ChatGPT — и другие важные новости за неделю

Руководство индийского стартапа Dukaan утверждает, что компании удалось заменить 90% сотрудников техподдержки чат-ботом. Расходы на подразделение при этом сократились на 85%, а скорость решения запросов в некоторых случаях снизилась с 2-х часов до 3-х минут;

Конструктор сайтов Wix показал инструмент, который позволяет сгенерировать страничку по текстовому запросу. Разработчики говорят, что модель работает не с шаблонами, а в каждом случае генерирует действительно уникальный сайт. Дату релиза пока не называют;

Производитель йогуртов Epica с помощью нейросетей создал инфлюенсера по имени Саммер, которая в июле–августе будет вести соцсети бренда. Прошлым летом Epica использовала нейросети для генерации изображений к постам в своих соцсетях;

Жюри фотоконкурса в Австралии отказалось допустить фото одной из претенденток, решив, что его сгенерировал ИИ. На снимке был изображен 18-летний сын женщины;

Компаниям придется платить Microsoft по $30 в месяц за каждого сотрудника, которому подключат умного ассистента Copilot для офисных приложений. Это в 2,5 раза больше, чем стоимость базовой подписки сервиса Windows 365, к которому предлагается докупить Copilot;

Meta* выпустила для коммерческого использования языковую модель Llama-2. Компании могут бесплатно использовать Llama, но есть и ограничения. Например, если вашим сервисом, созданным на основе модели, будут пользоваться больше 700 млн пользователей в день, то придется идти к Meta за лицензией;

Google тестирует возможность генерировать с помощью нейросетей фоны для видеозвонков в сервисе Meet. Пользователи смогут создавать экзотические бэкграунды, используя текстовые подсказки;

Apple тоже работает над своим аналогом ChatGPT и сразу несколькими языковыми моделями. Правда, компания пока не очень понимает, где они могут применить эти разработки;

Tesla готова инвестировать миллиард долларов в разработку собственного суперкомпьютера, чтобы не зависеть от Nvidia, у которой перманентный дефицит чипов. Илон Маск уже и название для компьютера придумал — Dojo;

Компания Cerebras Systems показала самый мощный суперкомпьютер для обучения ИИ. У Condor Galaxy-1 54 млн ядер, которые обеспечивают производительность в 4 эксафлопса. 3 устройства уже предзаказали в ОАЭ и США;

Сбер выложил в открытый доступ языковые модели ruGPT-3,5 и mGPT 13B. 1-я лежит в основе сервиса GigaChat и генерирует тексты на русском языке, 2-я — самая большая из многоязычных моделей Сбера и генерирует тексты на 61-м языке.

*Организация, запрещенная на территории РФ
👍4
Media is too big
VIEW IN TELEGRAM
Сервис, который сгенерирует эпизод South Park с вами в главной роли 🎬

Стартап из Сан-Франциско Fable показал сервис Showrunner AI, который с помощью ИИ может с нуля сгенерировать эпизод «Южного парка» с вами в роли одного из персонажей. Для этого в программу нужно загрузить свое фото 📷.

☝️ Новинка может буквально все: написать сценарий, озвучить и анимировать героев, смонтировать эпизод. Программа может создать эпизод по собственному сценарию или использовать текстовую подсказку из пары предложений.

Видео выше — пример работы Showrunner AI. Полностью 20-минутную серию можно посмотреть здесь.

🚨 Чтобы избежать юридических проблем, Fable не собирается выпускать Showrunner AI для бесплатного или коммерческого использования. По словам разработчиков, вместо этого они ведут переговоры с другими командами для создания оригинальных IP с помощью сервиса.

😐 Журналисты, которым удалось посмотреть модель в действии, нашли у нее множество косяков (скажем, шутки не дотягивают по уровню даже до самых слабых эпизодов «Парка»). Но мало кто считает это большой проблемой, учитывая темпы развития ИИ-алгоритмов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤯2👍1
Дипфейки внедрят вам воспоминания о том, чего никогда не существовало 🤯

Это выяснилось в результате эксперимента, который провели в Университетском колледже Корка в Ирландии.

🎞 Исследователи показали 400 участникам дипфейк-видео и текстовые описания фильмов-ремейков, которые никогда не снимали. Например, «Капитан Марвел» с Шарлиз Терон в главной роли или «Сияние» с Брэдом Питтом и Анджелиной Джоли. В подборке также были видео из реально существующих фильмов.

Каждому участнику эксперимента показывали 4 настоящие кинокартины и 2 фейковые.

🤨 По итогу 75% процентов заявили, что слышали о ремейке «Капитана Марвел» с Терон, а 40% были уверены, что все фильмы-фейки, о которых им сказали, существуют в реальности.

Интересно, что количество поверивших в существование фейковых фильмов практически не менялось в зависимости от того, показывали им дипфейки или просто зачитали описание фильма. Некоторые даже говорили, что ремейк (которого на самом деле не существует) понравился им больше, чем оригинал 😮.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Посмотрите, как Midjourney и GEN-2 работают вместе 🤝

Идея простая: Midjourney генерирует картинки, а GEN-2 их анимирует.

Завораживающий ролик выложил пользователь Creative.Edge в соцсети X, ранее известной как Twitter 🤦‍♀️.

Возможность анимировать загруженные пользователем статичные изображения появилась в GEN-2 совсем недавно. Потестировать может любой, но понадобится регистрация 📄.
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
📸 Фотокамера со встроенной Stable Diffusion

Продакт дизайнер Snapchat Кайл Гудрич показал DreamGenerator — прототип фотоаппарата с интегрированной нейросетью Stable Diffusion в связке с ControlNet 🔗.

Для удобства пользователя в DreamGenerator есть 30 промптов-пресетов (ретро, сказка, зомби и т. д.), которые помогают быстро отредактировать только что сделанное фото 🖼.

🫰 Гудрич говорит, что его целью было максимально упростить работу с нейросетью и текстовыми подсказками, поэтому о технической начинке камеры он думал в последнюю очередь.

Коммерческий релиз камеры Гудрич не планирует.

🌍 Похожую на DreamGenerator камеру уже показывали весной. Paragraphica тоже работает на Stable Diffusion, но сгенерированные фото привязаны к местонахождению пользователя, которое девайс самостоятельно геолоцирует.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Нейромиксер для изображений 🥘

Сайт Artbreeder — ветеран в деле художественного редактирования картинок — запустил функцию Mixer, которая позволяет с помощью нейросети объединять между собой изображения.

✍️ Результат потом легко отредактировать промптом.

Попробовать можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
🏆 LLM, которая может работать с 3D-моделями

👨‍🔬 Ученые из MIT и Калифорнийского университета обучили языковую модель работе с 3-мерными объектами. Нейросеть анализирует 3D-объект и может сгенерировать к нему описание, помочь с навигацией, ответить на вопросы, разработать алгоритм для выполнения задачи в пределах такой модели.

📹 На видео — пример работы такой LLM. Пользователь спрашивает, есть ли в 3-мерной модели комнаты что-то, чем можно погладить одежду, а нейросеть отвечает: да, есть утюг, он около вешалки. 👕

Авторы исследования отмечают: современным языковым моделям недостает навыков работы с 3-мерным миром: понимания, как объекты располагаются в пространстве относительно друг друга и как они могут взаимодействовать. Новые LLM закроют эти недостатки. 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥81
This media is not supported in your browser
VIEW IN TELEGRAM
Гигантская Барби вышла из коробки в Дубае

🏛 Ролик снят рядом с Бурдж-Халифа, самым высоким зданием в мире. В глазах зрителя Барби не сильно уступает зданию по высоте. Внешний вид Барби — полосатый купальник, прическа, солнечные очки — очень похож на то, как выглядела самая 1-я кукла этого бренда в 1959 году🩱.

Видео создало креативное агентство Eye Studio — естественно, к мировой премьере фильма про Барби. За 4 дня его посмотрели 3 млн раз. Хотя зрители разошлись в оценках — многие пишут, что словили бы сердечный приступ, увидев такое в реальной жизни😱.
🤔5
Как Spotify собирается внедрять ИИ в сервис

Планами на ИИ-будущее крупнейшего музыкального стриминга поделился СЕО Spotify Дэниэль Эк на звонке с инвесторами. Вот что он рассказал:

✍️ Spotify запустит саммарайзинг подкастов. По задумке — слушателям так будет легче знакомиться с новыми подкастами, что приведет только к усилению взаимодействия (а не к отказу от подкаста в пользу саммари).

🔊 Аудиорекламу будет генерировать ИИ. Рекламодатели смогут запускать множество разных вариантов объявлений и тестировать их в рекламной сети Spotify.

📲 Еще Дэниэль Эк пообещал более активно использовать ИИ для более глубокой персонализации всего сервиса — тут пока без конкретики.

У Spotify уже есть ИИ-продукт, который в компании считают успешным — это виртуальный диджей, который подбирает треки и комментирует их как радиоведущий. Дэниэль Эк заявил, что подписчики сервиса очень активно пользуются услугами виртуального диджея, хотя конкретных чисел не назвал. 💿

TechCrunch предполагает, что Дэниэль Эк раскрыл еще не все карты. В прошлом году Spotify приобрел стартап по синтезу голосов Sonantic, а сейчас подал заявку на патент text-to-speech системы, которая может передавать эмоции. Возможно, Spotify возьмется, например, за озвучку аудиокниг с помощью ИИ. 📖
7
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть, которая поможет обставить квартиру

🛋 Она называется Decorify, ее запускает американский онлайн-магазин мебели Wayfair. Пользователь загружает в приложение фотографию своей квартиры и задает желаемый стиль интерьера, а Decorify предлагает на выбор несколько вариантов нового дизайна. 🖼

Что интересно, Decorify обставляет комнату предметами, которые есть в продаже на Wayfair. Пользователь может заказать понравившуюся мебель прямо из интерфейса Decorify — элементы интерьера в генерациях кликабельны и ведут в онлайн-магазин.🛒
👍2
Вышла новая версия Stable Diffusion, Meta* потеряла на метавселенных и VR еще $3,7 млрд за квартал — и другие важные новости за неделю

В семействе чат-ботов Microsoft может появиться пополнение. LinkedIn работает над своим ИИ чат-ботом, который будет помогать с поиском работы, обучением и расширением нетворка;

OpenAI поддержало выдачу лицензий на разработку продвинутых ИИ. Компания говорит, что так регуляторам будет проще отслеживать новых участников рынка. Критики уверены: так OpenAI защищается от будущей конкуренции со стартапами и open source-моделями;

Anthropic, Google, Microsoft и OpenAI запускают Frontier Model Forum — некоммерческую организацию для регулирования работы ИИ. Интересно, что Meta* или Amazon в их организации нет;

У ChatGPT появилось приложение для Android: на этой неделе оно вышло для США, Индии, Бангладеша и Бразилии. Список стран постепенно будут расширять;

А чат-бот Bing, который ранее работал эксклюзивно в браузере Microsoft Edge, станет доступен в браузерах Chrome и Safari в виде расширений. Но для Chrome лимиты на число сообщений и длину реплик в Bing Chat ниже, чем в Edge;

Тинькофф запустил алгоритм Саундтрат, который превращает расходы пользователей в музыку. Саундтрат анализирует, сколько, в какое время суток, в каких категориях клиент платил чаще. На основе этого алгоритм выбирает музыкальные эффекты, из которых генерирует трек;

Meta* потратила на VR и метавселенную еще $3,7 млрд за квартал. Всего убытки подразделения Reality Lab достигли уже $21 млрд. Останавливаться Цукерберг пока не намерен;

Amazon запустила Agents for Bedrock, набор инструментов для создания ИИ-приложений, которые смогут выполнять задачи самостоятельно. Фактически, Amazon занимает роль конструктора в ИИ-гонке;

Stability AI выпустила Stable Diffusion XL 1.0 — новую версию своей text2image нейросети. Stable Diffusion XL 1.0 дает более яркие и точные цвета, менее требовательна к вычислительным мощностям;

Samsung рассказал, что готовит к запуску свой генеративный ИИ, который «поселится» в смартфонах, планшетах, умных часах и даже наушниках. Ранее было известно, что Samsung разрабатывает внутренний аналог ChatGPT, но для нужд сотрудников (которым запретил пользоваться ChatGPT).


*Организация, запрещенная на территории РФ
👍3
Media is too big
VIEW IN TELEGRAM
Новый конкурент GEN — на этот раз из Израиля 🇮🇱

TokenFlow, как и модель Runway, может редактировать исходное видео по промпту. Но разработчики особенно гордятся тем, насколько консистентным получается результат 😱.

Если верить видео, то сгенерированные клипы действительно получаются очень плавными и почти не дергаются в припадке, как это бывает у аналогичных моделей 🙂.

TokenFlow, как утверждают авторы, эффективно работает с любым text2image-методом и не требует дополнительных обучения и настройки 📚.

Попробовать пока нельзя, но разработчики обещают выложить код в ближайшее время.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Приложение от создателей Instagram* зачитает новости голосом Снуп Догга 🎙

👂 В новостной агрегатор Artifact (подробнее о нем здесь) интегрировали text2speech-сервис Speechify. Теперь новости можно не только почитать, но и послушать — в исполнении Снуп Догга, Гвинет Пэлтроу и еще 30+ синтетических голосов.

🍏 Пока обновление доступно только в iOS-приложении, но скоро обещают и на Android.

🫤 Те, кто успел попробовать обновление, говорят, что синтетические голоса в Artifact страдают всеми стандартными болезнями: монотонность, неправильные интонации, ошибки в ударении и т. д.

Разработчики Artifact вообще активно добавляют в приложение ИИ-возможности. Например, в июне агрегатор научился переписывать кликбейтные новостные заголовки с помощью GPT-4 📰.

ИИ-алгоритмы также помогают пользователю найти новости на интересующие его темы, а встроенный в Artifact чат-бот может пересказать новость за пару предложений.

*Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2
Media is too big
VIEW IN TELEGRAM
VideoControlNet — для тех, кто хочет контролировать создание нейровидео

🕓 Video-to-Video и Text-to-Video-модели типа GEN прогрессируют не по дням, а по часам, но результаты их работы все еще нестабильны — сгенерированные клипы часто получаются дергаными, а милый щенок из 1-го кадра уже в следующем превращается в монстра (самые адовые примеры можно посмотреть тут).

🇭🇰 На помощь приходят исследователи из Гонконга, которые придумали VideoControlNet — аналог популярного ControlNet, но для видеогенераций.

🎞 Принцип работы VideoControlNet вдохновлен видеокодеками (известными всем mkv, avi и другими), которые сжимают исходное видео, стараясь сохранить исходное качество.

🧹 Схожим образом VideoControlNet оптимизирует видеогенерацию, убирая из нее лишнюю информацию, которая появляется в результате работы нейросети. В итоге получается консистентный клип.

Пока авторы поделились только готовыми примерами работы модели, но скоро обещают выложить код, чтобы все могли ее попробовать.
🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🧙‍♂️ Нейросеть для генерации 3D-объектов в AR

Модель компании Devar позволяет создавать ассеты по текстовой подсказке, а затем использовать их в приложениях на iOS и Android.

☁️ Нейронка интегрирована в платформу, разработанную компанией, которая объединяет другие ИИ-модели и облачные сервисы для создания разного AR-контента.

Разработчики утверждают, что хорошо поработали над оптимизацией нейросети, что позволяет работать с генерациями даже на бюджетных смартфонах ☎️.

Если захотелось попробовать сервис, то сначала нужно будет зарегистрироваться на платформе MyWebAR.

💲 Кстати, Devar основан уроженкой Тулы Анной Беловой, которая в 2019 году стала победителем рейтинга молодых предпринимателей Forbes «30 до 30». С момента запуска в 2015 году компании удалось привлечь $5 млн инвестиций.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5