D. Lab – Telegram

D. Lab

1.11K subscribers

503 photos

499 videos

1 file

900 links

Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.

Download Telegram

About

Blog

Apps

Platform

1.11K subscribers

Media is too big

VIEW IN TELEGRAM

Сервис, который сгенерирует эпизод South Park с вами в главной роли 🎬

Стартап из Сан-Франциско Fable показал сервис Showrunner AI, который с помощью ИИ может с нуля сгенерировать эпизод «Южного парка» с вами в роли одного из персонажей. Для этого в программу нужно загрузить свое фото 📷.

☝️ Новинка может буквально все: написать сценарий, озвучить и анимировать героев, смонтировать эпизод. Программа может создать эпизод по собственному сценарию или использовать текстовую подсказку из пары предложений.

Видео выше — пример работы Showrunner AI. Полностью 20-минутную серию можно посмотреть здесь.

🚨 Чтобы избежать юридических проблем, Fable не собирается выпускать Showrunner AI для бесплатного или коммерческого использования. По словам разработчиков, вместо этого они ведут переговоры с другими командами для создания оригинальных IP с помощью сервиса.

😐 Журналисты, которым удалось посмотреть модель в действии, нашли у нее множество косяков (скажем, шутки не дотягивают по уровню даже до самых слабых эпизодов «Парка»). Но мало кто считает это большой проблемой, учитывая темпы развития ИИ-алгоритмов.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2🤯2👍1

776 views11:25

Дипфейки внедрят вам воспоминания о том, чего никогда не существовало 🤯

Это выяснилось в результате эксперимента, который провели в Университетском колледже Корка в Ирландии.

🎞 Исследователи показали 400 участникам дипфейк-видео и текстовые описания фильмов-ремейков, которые никогда не снимали. Например, «Капитан Марвел» с Шарлиз Терон в главной роли или «Сияние» с Брэдом Питтом и Анджелиной Джоли. В подборке также были видео из реально существующих фильмов.

Каждому участнику эксперимента показывали 4 настоящие кинокартины и 2 фейковые.

🤨 По итогу 75% процентов заявили, что слышали о ремейке «Капитана Марвел» с Терон, а 40% были уверены, что все фильмы-фейки, о которых им сказали, существуют в реальности.

Интересно, что количество поверивших в существование фейковых фильмов практически не менялось в зависимости от того, показывали им дипфейки или просто зачитали описание фильма. Некоторые даже говорили, что ремейк (которого на самом деле не существует) понравился им больше, чем оригинал 😮.

Please open Telegram to view this post

VIEW IN TELEGRAM

504 views15:35

This media is not supported in your browser

VIEW IN TELEGRAM

Посмотрите, как Midjourney и GEN-2 работают вместе 🤝

Идея простая: Midjourney генерирует картинки, а GEN-2 их анимирует.

Завораживающий ролик выложил пользователь Creative.Edge в соцсети X, ранее известной как Twitter 🤦‍♀️.

Возможность анимировать загруженные пользователем статичные изображения появилась в GEN-2 совсем недавно. Потестировать может любой, но понадобится регистрация 📄.

👍6❤1

660 views09:55

This media is not supported in your browser

VIEW IN TELEGRAM

📸 Фотокамера со встроенной Stable Diffusion

Продакт дизайнер Snapchat Кайл Гудрич показал DreamGenerator — прототип фотоаппарата с интегрированной нейросетью Stable Diffusion в связке с ControlNet 🔗.

Для удобства пользователя в DreamGenerator есть 30 промптов-пресетов (ретро, сказка, зомби и т. д.), которые помогают быстро отредактировать только что сделанное фото 🖼.

🫰 Гудрич говорит, что его целью было максимально упростить работу с нейросетью и текстовыми подсказками, поэтому о технической начинке камеры он думал в последнюю очередь.

Коммерческий релиз камеры Гудрич не планирует.

🌍 Похожую на DreamGenerator камеру уже показывали весной. Paragraphica тоже работает на Stable Diffusion, но сгенерированные фото привязаны к местонахождению пользователя, которое девайс самостоятельно геолоцирует.

👍2

502 views15:15

This media is not supported in your browser

VIEW IN TELEGRAM

Нейромиксер для изображений 🥘

✨ Сайт Artbreeder — ветеран в деле художественного редактирования картинок — запустил функцию Mixer, которая позволяет с помощью нейросети объединять между собой изображения.

✍️ Результат потом легко отредактировать промптом.

Попробовать можно здесь.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥2❤1

669 views09:55

This media is not supported in your browser

VIEW IN TELEGRAM

🏆

LLM, которая может работать с 3D-моделями

👨‍🔬 Ученые из MIT и Калифорнийского университета обучили языковую модель работе с 3-мерными объектами. Нейросеть анализирует 3D-объект и может сгенерировать к нему описание, помочь с навигацией, ответить на вопросы, разработать алгоритм для выполнения задачи в пределах такой модели.

📹 На видео — пример работы такой LLM. Пользователь спрашивает, есть ли в 3-мерной модели комнаты что-то, чем можно погладить одежду, а нейросеть отвечает: да, есть утюг, он около вешалки. 👕

Авторы исследования отмечают: современным языковым моделям недостает навыков работы с 3-мерным миром: понимания, как объекты располагаются в пространстве относительно друг друга и как они могут взаимодействовать. Новые LLM закроют эти недостатки. 💪

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤1

522 views14:29

This media is not supported in your browser

VIEW IN TELEGRAM

Гигантская Барби вышла из коробки в Дубае

🏛 Ролик снят рядом с Бурдж-Халифа, самым высоким зданием в мире. В глазах зрителя Барби не сильно уступает зданию по высоте. Внешний вид Барби — полосатый купальник, прическа, солнечные очки — очень похож на то, как выглядела самая 1-я кукла этого бренда в 1959 году🩱.

Видео создало креативное агентство Eye Studio — естественно, к мировой премьере фильма про Барби. За 4 дня его посмотрели 3 млн раз. Хотя зрители разошлись в оценках — многие пишут, что словили бы сердечный приступ, увидев такое в реальной жизни😱.

🤔5

558 views14:58

Как Spotify собирается внедрять ИИ в сервис

Планами на ИИ-будущее крупнейшего музыкального стриминга поделился СЕО Spotify Дэниэль Эк на звонке с инвесторами. Вот что он рассказал:

✍️ Spotify запустит саммарайзинг подкастов. По задумке — слушателям так будет легче знакомиться с новыми подкастами, что приведет только к усилению взаимодействия (а не к отказу от подкаста в пользу саммари).

🔊 Аудиорекламу будет генерировать ИИ. Рекламодатели смогут запускать множество разных вариантов объявлений и тестировать их в рекламной сети Spotify.

📲 Еще Дэниэль Эк пообещал более активно использовать ИИ для более глубокой персонализации всего сервиса — тут пока без конкретики.

У Spotify уже есть ИИ-продукт, который в компании считают успешным — это виртуальный диджей, который подбирает треки и комментирует их как радиоведущий. Дэниэль Эк заявил, что подписчики сервиса очень активно пользуются услугами виртуального диджея, хотя конкретных чисел не назвал. 💿

TechCrunch предполагает, что Дэниэль Эк раскрыл еще не все карты. В прошлом году Spotify приобрел стартап по синтезу голосов Sonantic, а сейчас подал заявку на патент text-to-speech системы, которая может передавать эмоции. Возможно, Spotify возьмется, например, за озвучку аудиокниг с помощью ИИ. 📖

❤7

572 views08:08

This media is not supported in your browser

VIEW IN TELEGRAM

Нейросеть, которая поможет обставить квартиру

🛋 Она называется Decorify, ее запускает американский онлайн-магазин мебели Wayfair. Пользователь загружает в приложение фотографию своей квартиры и задает желаемый стиль интерьера, а Decorify предлагает на выбор несколько вариантов нового дизайна. 🖼

Что интересно, Decorify обставляет комнату предметами, которые есть в продаже на Wayfair. Пользователь может заказать понравившуюся мебель прямо из интерфейса Decorify — элементы интерьера в генерациях кликабельны и ведут в онлайн-магазин.🛒

👍2

584 views12:01

Вышла новая версия Stable Diffusion, Meta* потеряла на метавселенных и VR еще $3,7 млрд за квартал — и другие важные новости за неделю

✅ В семействе чат-ботов Microsoft может появиться пополнение. LinkedIn работает над своим ИИ чат-ботом, который будет помогать с поиском работы, обучением и расширением нетворка;

✅ OpenAI поддержало выдачу лицензий на разработку продвинутых ИИ. Компания говорит, что так регуляторам будет проще отслеживать новых участников рынка. Критики уверены: так OpenAI защищается от будущей конкуренции со стартапами и open source-моделями;

✅ Anthropic, Google, Microsoft и OpenAI запускают Frontier Model Forum — некоммерческую организацию для регулирования работы ИИ. Интересно, что Meta* или Amazon в их организации нет;

✅ У ChatGPT появилось приложение для Android: на этой неделе оно вышло для США, Индии, Бангладеша и Бразилии. Список стран постепенно будут расширять;

✅ А чат-бот Bing, который ранее работал эксклюзивно в браузере Microsoft Edge, станет доступен в браузерах Chrome и Safari в виде расширений. Но для Chrome лимиты на число сообщений и длину реплик в Bing Chat ниже, чем в Edge;

✅ Тинькофф запустил алгоритм Саундтрат, который превращает расходы пользователей в музыку. Саундтрат анализирует, сколько, в какое время суток, в каких категориях клиент платил чаще. На основе этого алгоритм выбирает музыкальные эффекты, из которых генерирует трек;

✅ Meta* потратила на VR и метавселенную еще $3,7 млрд за квартал. Всего убытки подразделения Reality Lab достигли уже $21 млрд. Останавливаться Цукерберг пока не намерен;

✅ Amazon запустила Agents for Bedrock, набор инструментов для создания ИИ-приложений, которые смогут выполнять задачи самостоятельно. Фактически, Amazon занимает роль конструктора в ИИ-гонке;

✅ Stability AI выпустила Stable Diffusion XL 1.0 — новую версию своей text2image нейросети. Stable Diffusion XL 1.0 дает более яркие и точные цвета, менее требовательна к вычислительным мощностям;

✅ Samsung рассказал, что готовит к запуску свой генеративный ИИ, который «поселится» в смартфонах, планшетах, умных часах и даже наушниках. Ранее было известно, что Samsung разрабатывает внутренний аналог ChatGPT, но для нужд сотрудников (которым запретил пользоваться ChatGPT).

*Организация, запрещенная на территории РФ

👍3

488 views09:00

Media is too big

VIEW IN TELEGRAM

Новый конкурент GEN — на этот раз из Израиля 🇮🇱

TokenFlow, как и модель Runway, может редактировать исходное видео по промпту. Но разработчики особенно гордятся тем, насколько консистентным получается результат 😱.

Если верить видео, то сгенерированные клипы действительно получаются очень плавными и почти не дергаются в припадке, как это бывает у аналогичных моделей 🙂.

TokenFlow, как утверждают авторы, эффективно работает с любым text2image-методом и не требует дополнительных обучения и настройки 📚.

Попробовать пока нельзя, но разработчики обещают выложить код в ближайшее время.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

491 views08:00

Приложение от создателей Instagram* зачитает новости голосом Снуп Догга

🎙

👂 В новостной агрегатор Artifact (подробнее о нем здесь) интегрировали text2speech-сервис Speechify. Теперь новости можно не только почитать, но и послушать — в исполнении Снуп Догга, Гвинет Пэлтроу и еще 30+ синтетических голосов.

🍏 Пока обновление доступно только в iOS-приложении, но скоро обещают и на Android.

🫤 Те, кто успел попробовать обновление, говорят, что синтетические голоса в Artifact страдают всеми стандартными болезнями: монотонность, неправильные интонации, ошибки в ударении и т. д.

Разработчики Artifact вообще активно добавляют в приложение ИИ-возможности. Например, в июне агрегатор научился переписывать кликбейтные новостные заголовки с помощью GPT-4 📰.

ИИ-алгоритмы также помогают пользователю найти новости на интересующие его темы, а встроенный в Artifact чат-бот может пересказать новость за пару предложений.

*Instagram входит в Meta — организацию, запрещенную на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥2

477 views07:45

Media is too big

VIEW IN TELEGRAM

VideoControlNet — для тех, кто хочет контролировать создание нейровидео

🕓 Video-to-Video и Text-to-Video-модели типа GEN прогрессируют не по дням, а по часам, но результаты их работы все еще нестабильны — сгенерированные клипы часто получаются дергаными, а милый щенок из 1-го кадра уже в следующем превращается в монстра (самые адовые примеры можно посмотреть тут).

🇭🇰 На помощь приходят исследователи из Гонконга, которые придумали VideoControlNet — аналог популярного ControlNet, но для видеогенераций.

🎞 Принцип работы VideoControlNet вдохновлен видеокодеками (известными всем mkv, avi и другими), которые сжимают исходное видео, стараясь сохранить исходное качество.

🧹 Схожим образом VideoControlNet оптимизирует видеогенерацию, убирая из нее лишнюю информацию, которая появляется в результате работы нейросети. В итоге получается консистентный клип.

Пока авторы поделились только готовыми примерами работы модели, но скоро обещают выложить код, чтобы все могли ее попробовать.

🔥5👍3

815 viewsedited 14:45

This media is not supported in your browser

VIEW IN TELEGRAM

🧙‍♂️

Нейросеть для генерации 3D-объектов в AR

Модель компании Devar позволяет создавать ассеты по текстовой подсказке, а затем использовать их в приложениях на iOS и Android.

☁️ Нейронка интегрирована в платформу, разработанную компанией, которая объединяет другие ИИ-модели и облачные сервисы для создания разного AR-контента.

Разработчики утверждают, что хорошо поработали над оптимизацией нейросети, что позволяет работать с генерациями даже на бюджетных смартфонах ☎️.

Если захотелось попробовать сервис, то сначала нужно будет зарегистрироваться на платформе MyWebAR.

💲 Кстати, Devar основан уроженкой Тулы Анной Беловой, которая в 2019 году стала победителем рейтинга молодых предпринимателей Forbes «30 до 30». С момента запуска в 2015 году компании удалось привлечь $5 млн инвестиций.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5

531 views10:01

This media is not supported in your browser

VIEW IN TELEGRAM

👩‍🚀 У NASA будет свой стриминг-сервис

NASA+ будет бесплатной платформой, на которой появятся документальные передачи о работе космического агентства. Контент будет как архивным, так и совсем новым, снятым специально для NASA+.

📺 Сейчас для этих целей у агентства есть канал NASA TV, но выглядит он по меркам 2023 года совсем уж устаревшим.

🌐 Вместе с запуском стриминга, агентство перезапустит свой сайт (сейчас доступен в бете) и обновит мобильное приложение. Через сайт и приложение будет доступен и стриминг-сервис.

Запуск NASA+ состоится «позже этим летом».

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7

505 views15:45

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Text-to-Video-модель Pika Labs стала доступна для всех

🥱 Если вам уже наскучили модели для генерации видео по промпту, о которых мы писали до этого, то вот вам новичок. Pika Labs находится на этапе открытого тестирования и бесплатно доступна через Discord.

☝️ Количество генераций ограничено 10 изображениями за 5 минут. Модель также позволяет анимировать готовые картинки.

Откровений не ждите, но выглядят генерации очень достойно 👍.

Подробнее про работу с сервисом можно почитать здесь.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

701 views10:55

Nvidia показала нейросеть, которая весит всего 100 кб

💾 Генеративка Perfusion мало того что помещается на дискету, так еще и время ее обучения составило всего 4 минуты. Та же Midjourney требует больше 2 гигабайт свободного места.

🔑 Добиться этого удалось благодаря механизму, который Nvidia назвала Key-Locking. Благодаря ему модель может «привязывать» конкретный запрос пользователя к общей категории (или суперкатегории).

😽 Например, если пользователь попросит сгенерировать кота, то модель приоритетно соотнесет запрос «кот» с суперкатегорией «семейство кошачьих», а затем начнет обрабатывать детали из текстовой подсказки. Такой способ повышает скорость работы алгоритма.

🤸 Гибкость модели позволяет настраивать ее под конкретный случай — когда пользователю нужно, чтобы Perfusion следовал максимально близко к текстовой подсказке, и когда модели можно дать «свободу творчества».

Так ли великолепно работает Perfusion на самом деле — сказать пока сложно. Код разработчики обещают опубликовать позже.

❤4🔥1

664 views15:55

This media is not supported in your browser

VIEW IN TELEGRAM

Meta* выпустила AudioCraft — аудиоинструмент сразу с 3-мя ИИ-моделями внутри

☝️

🎵 AudioCraft может генерировать музыку и аудио в высоком качестве по текстовой подсказке.

🛠 В основе инструмента лежат 3 модели: MusicGen (подробнее о ней тут), AudioGen и EnCodec. 1-я генерирует музыку, 2-я — остальной аудиоконтент, а EnCodec следит за тем, чтобы все это хорошо звучало.

🎹 Разработчики уверены, что их программа может стать революционным инструментом, каким когда-то стал синтезатор.

🧪 Meta* призывает всех экспериментировать с AudioCraft, поэтому на GitHub можно разжиться исходниками.

*Организация, запрещенная на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

590 views13:25