D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🖨 StyleDrop — нейросеть от Google, которая скопирует любой стиль

Модель может взять визуальный стиль исходного изображения, а затем перенести его на последующие генерации со всеми нюансами.

При этом изображения могут быть диаметрально противоположными друг другу: за основу можно взять детский рисунок и сгенерировать стилизованный логотип или персонажа.

В основе StyleDrop лежит скоростная Text-to-Image-модель Muse. Нейросеть тренируется, в частности, на генерируемых изображениях, получая фидбек от пользователя или с помощью Clip Score. В любом случае генерация занимает не больше трех минут.

👍 StyleDrop в теории может стать незаменимым инструментом для брендов при разработке визуального стиля.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
This media is not supported in your browser
VIEW IN TELEGRAM
🥽 Apple показал Vision Pro — XR-гарнитуру за $3500 с собственной ОС

5 июня на конференции Worldwide Developers Conference Apple наконец-то показал гарнитуру смешанной реальности Vision Pro. Вот что это за зверь:

📸 Гарнитура оснащена двумя 4K микро-OLED дисплеями собственной разработки, которые отображают 23 млн пикселей. В устройство также встроена 3D-камера (она может записывать иммерсивные видео в формате VR-180) и TrueDepth-камера. Всего камер 12. Также в Vision Pro есть LIDAR и инфракрасные лампы, чтобы устройство могло считывать движения пользователя в темноте;

🏋️ Vision Pro поддерживает AR и VR-приложения и работает на отдельной операционной системе visionOS. Вес устройства — менее 500 г;

🕹 Для взаимодействия с Vision Pro не нужны отдельные контроллеры. Гарнитура управляется взглядом, голосом и жестами. Для безопасности в Vision Pro реализована новая система Optic ID, которая позволяет разблокировать устройство с помощью сканирования радужки глаз;

🛞 Устройство переключается между AR и VR колесиком как у Apple Watch;

Vision Pro может работать от сети или от внешнего аккумулятора, который держит заряд около двух часов;

📱 Для Vision Pro запустят отдельную версию AppStore;

🤔 Журналистам уже удалось протестировать гарнитуру и общее мнение можно описать так: действительно впечатляет, но пока не ясно, какое у устройства будет практическое применение;

👑 Apple явно не рассчитывает, что Vision Pro станет бестселлером как iPhone: устройство будет стоить $3,499 — гораздо дороже, чем цена любых конкурентов (анонсированная недавно Quest 3 стоит $499). Продажи Vision Pro стартуют в начале 2024 года. Полное видео с анонсом устройства можно посмотреть здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
💪 Stable Diffusion научили генерировать QR-коды

🔥 Нейросеть используют в связке с моделью Control Net. Результат — крутейшие изображения вместо унылого квадратика, на который никто не обращает внимание.

📷 Да, на изображения наверху можно навести камеру смартфона и перейти по ссылке — мы проверили. Правда, пишут, что способ работает только с короткими URL.

📚 QR-коды следующего поколения опубликовал на Reddit пользователь с ником Nhciao. Подробности можно почитать здесь через Google Translate.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
Создатель «Черного зеркала» попросил ChatGPT написать сценарий для сериала — и остался очень недоволен

✍️ Первым же запросом Чарли Брукера для чат-бота стал «Напиши эпизод „Черного зеркала“». Результат шоураннера расстроил. По его словам, алгоритм просто взял сюжетные завязки всех эпизодов шоу, а потом перемешал их.

«Когда читаешь первый раз, кажется, что получилось убедительно, но перечитываешь и понимаешь — полное 💩», — пояснил Брукер.

🚿 Зато ChatGPT помог понять автору, что он стал повторяться в своих сюжетах. Сгенерированный чат-ботом текст стал для него «стаканом ледяной воды, который плеснули в лицо». Поэтому в новом сезоне Брукер решил перепридумать «Черное зеркало».

📆 Новые эпизоды антиутопии выйдут на Netflix 15 июня.
🔥5👍4
Media is too big
VIEW IN TELEGRAM
🎦 ИИ снял 12-минутную короткометражку про застрявшую во льдах экспедицию

Над The Frost работала видеопродакшн-компания Waymark из Детройта. Каждый кадр в короткометражке сгенерирован и доработан нейросетью 🔨.

Мини-фильм делали с помощью Dall-E 2 и сервиса D-ID. Последний использовали для анимации. Создатели говорят, что не стремились к реалистичности картинки, а решили использовать «уникальный стиль» Dall-E 🤩.

The Frost больше напоминает стилизованные кат-сцены, которые часто используют в видеоиграх. Зато, в отличие от других подобных примеров, The Frost смотрится как цельное произведение, а не набор генераций, склеенных вместе ✂️.

Waymark уже планируют сиквел, но хотят делать его на более современном «движке» 🔩.

Посмотреть полную версию The Frost можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2👍1🔥1
🤖 🍅 ChatGPT спроектировал робота

🛠 Исследователи из Делфтского технического университета в Нидерландах и Федеральной политехнической школы Лозанны в Швейцарии предложили чат-боту с нуля разработать нового робота.

🤝 С помощью эксперимента исследователи хотели выяснить насколько в принципе возможна успешная коллаборация искусственного интеллекта и людей.

💬 ChatGPT предложил идею робота, который уничтожит человечество собирающего помидоры. Чат-бот не сразу выдал готовый результат. Инструкция по созданию робота создавалась постепенно, пока ИИ задавали релевантные вопросы. Например, ChatGPT решил, что часть устройства, которая будет собирать помидоры, должна быть из силикона или резины, чтобы не повредить плоды.

🙃 Общим местом стало утверждение, что ИИ в будущем заберет рутинную работу, а люди займутся креативом. В этом эксперименте получилось наоборот: алгоритм взял на себя разработку механизма, а люди только воплощали идеи чат-бота в жизнь.

👍 Построенный по инструкциям ChatGPT робот в итоге успешно справился со сбором урожая.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍1
This media is not supported in your browser
VIEW IN TELEGRAM
😱 ClipDrop — аналог Generative Fill из Photoshop, для людей, которые не пользуются Photoshop

👋 Знакомьтесь — Uncrop от ClipDrop. Все тоже самое, только бесплатно и вместо фотошоповской нейросетки Firefly, всю работу делает Stable Diffusion.

☝️ Инструмент может в аутпейнтинг, заменить или убрать фон, удалить текст, сделать апскейл и тд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🎉1
Gen-2 доступна всем, 4 тысячи человек потеряли работу из-за ИИ, в России появится нейросеть для поиска домашних животных — и другие важные новости за неделю

Text2Video-модель Gen-2 от Runway наконец-то стала доступна всем. Чтобы попробовать, нужно зарегистрироваться на сайте разработчика. По бесплатной подписке дают нагенерить 25 секунд видео, но один клип не может быть длиннее 4 секунд.

Apple ищет инженеров с опытом работы с алгоритмами машинного обучения, а также генеративными нейросетями и смешанной реальностью. Эксперты предполагают, что новые сотрудники будут работать над приложениями для хедсета Vision Pro. Он поступит в продажу в начале 2024 года;

Почти 4 тыс. человек в США потеряли работу из-за ИИ, следует из свежего отчета кадрового агентства Challenger, Gray and Christmas. Это первый случай, когда искусственный интеллект указали в качестве причины увольнения. Чем именно занимались эти несколько тысяч человек, не уточняется. Всего в стране в мае сократили 80 тыс. человек;

В России запустят нейросеть для распознавания домашних животных. Алгоритм будет помогать в поисках потерявшегося питомца. Разработкой занимается компания NtechLab — создатель системы распознавания лиц, которая широко используется в Москве;

Фотоагентство Getty попросило суд в Лондоне запретить продажу продуктов компании Stability AI (разработчик Stable Diffusion) на территории Великобритании. Причина ожидаема — фотоагентству не нравится, что нейросеть тренируют на его фотографиях;

Музыкальный стриминговый сервис Deezer будет использовать ИИ для обнаружения на платформе треков, сгенерированных нейросетями. Речь идет о композициях, сгенерированных на основе существующих треков, или с использованием клонированных голосов известных исполнителей. Алгоритм будет помечать синтетические треки, а затем оповещать о них правообладателей;

Нейросеть «Шедеврум» от Яндекса научилась иллюстрировать рекламу. Модель самостоятельно подберет подходящую по смыслу картинку из пула сгенерированных изображений. Что-то похожее готовит и Google. Инструмент в бета-версии доступен клиентам Яндекс Бизнеса;

Instagram* работает над аналогом ChatGPT, который появится внутри приложения. Пользователь сможет выбрать одну из 30 «личностей» чат-бота, задать ей вопрос и попросить совет;

В мессенджере Facebook* появятся стикеры, которые по запросу будет генерировать нейросеть. Перед большим запуском их дадут протестировать сотрудникам компании;

Облачная платформа VK Cloud запустила сервис для бизнеса Cloud Streams. Штука позволяет анализировать большой объем информации в реальном времени. С помощью Cloud Streams можно, например, оценить посещаемость сайта или мониторить безопасность системы.

*Организации, запрещенные на территории РФ
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
🚰 Hydrolab — физическая AR-головоломка в стиле Portal

🧩 Сооснователь игровой студии Alientrap Games Ли Вермюлен в свободное от основной работы время занимается созданием AR-головоломки с рабочим названием Hydrolab.

Больше всего Hydrolab напоминает «физические» головоломки вроде Portal или Talos Principle. Недавно Вермюлен добавил в игру новую механику — головоломки с жидкостью — и записал геймплейное видео 📹.

🔩 Вермюлен делает игру на движке Unity, а демо записывал на хедсете Varjo XR-3. За визуализацию жидкости отвечал ИИ-алгоритм от разработчиков из ZibraAI.

К сожалению, Hydrolab находится на самых ранних этапах разработки и попробовать красоту получится не скоро 😭.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Пользователь твиттера примерил на себя роли героев голливудских блокбастеров с помощью Gen-1

Сотрудник немецкой компании Trinity Agency, которая занимается кинопроизводством, Мартин Херлин с помощью модели Gen-1 создал ролик с собой в главной роли. Автор загрузил в нейросеть короткое видео, а затем накидал ей несколько промптов 💬.

🫰 В клипе Херлин по щелчку пальцев меняет не только сеттинг, но и полностью меняется сам: то он посыльный из Отеля «Гранд Будапешт»; то женщина, похожая на Лару Крофт; то один из героев Планеты обезьян. За аудио отвечает сервис от Eleven Labs.

👀 Ролик так круто сделан, что на момент написания текста собрал 1,7 млн просмотров в твиттере.

🔨 Удалось ли Херлину добиться таких результатов, используя только Gen-1, или видео все-таки пришлось доработать — он не уточнил.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🤹 Meta* показала мультимодальный ChatGPT для музыки

⌨️ Open Source-модель MusicGen позволяет по текстовому запросу создать музыкальный трек.

🎶 MusicGen не первый пример музыкальной генеративки, а ее главным конкурентом можно считать MusicLM от Google. По некоторым тестам MusicGen даже обходит MusicLM по качеству генераций.

Отличительная особенность MusicGen в том, что модель понимает как текстовые, так и аудиопромпты. То есть в алгоритм можно загрузить готовое произведение, а затем описать, как MusicGen должен его доработать 🔨.

☝️ Модель тренировали на 20 тыс. часов музыки (из них 10 тыс. часов — лицензионных треков), а также на 390 тыс. инструментальных треков из библиотек Shutterstock и Pond5.

Демо модели можно попробовать на Hugging Face.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
💬 AnythingLLM — чат-бот, чтобы поболтать с любыми документами

Модель позволяет использовать практически любой контент в качестве информации для обучения чат-бота 🥚.

AnythingLLM можно скармливать не только деловые документы, но и книги, блоги и даже целые YouTube-каналы 🍽.

Можно сказать, что AnythingLLM — всеядный и более продвинутый аналог ChatPDF, о котором мы рассказывали. От схожей по способностям PrivateGPT модель отличается удобством использования за счет более user friendly-интерфейса 🤝.

AnythingLLM еще и не требователен к ресурсам.

Код на GitHub.

Большой обзор AnythingLLM.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
Video2Video модель, которая может стать серьезным конкурентом Gen-1 🥊

Пока что безымянную модель анонсировали на GitHub инженеры из Наньянского технологического университета в Сингапуре 🇸🇬.

👍 Ключевое отличие модели от конкурентов — в высоком уровне консистентности генерации при минимальных затрачиваемых ресурсах. В итоге получается плавная анимация практически без артефактов. При этом модель четко следует заданному промпту, а не занимается импровизацией (это частая претензия к Gen).

🤫 Тут стоит отметить, что пока разработчикам можно только поверить на слово — код они обещают выложить позже.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1