D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🥫🤖 Производитель супов Campbell's провел ребрендинг с помощью нейросетей

Культовый продукт, увековеченный Энди Уорхолом, решили немного освежить с помощью генеративного ИИ.

🧑‍🎨 Банку супа прогнали через нейросети и представили, как бы выглядел продукт, если бы над ним работали другие знаменитые художники: Пикассо, Ван Гог, Дали.

Проект назвали Campbell’s pAIntings. Какую именно нейросеть использовали для генераций, авторы не раскрывают 🤫.

Больше иллюстраций тут.

📰 Если хотите почитать, как еще бренды используют ИИ для рекламы, то вам сюда.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
🎞 Создание анимации из двух кадров

У модели DynamiCrafter от Tencent в последнем обновлении появилась функция Generative Frame Interpolation.

👷 Она позволяет «достроить» анимацию из двух исходных кадров — первого и последнего.

♻️ Также после апдейта модель научилась создавать зацикленные видео.

📺 Основной фишкой DynamiCrafter разработчики считают использование для анимации сразу визуальной и текстовой информации — модель получает исходное изображение и, грубо говоря, его текстовое описание. Это позволяет повысить визуальную детализацию изображения, а также сделать анимацию более естественной.

📝 Разработчики считают, что DynamiCrafter особенно подойдет для сторителлинга.

Код есть на GitHub, демо — на HuggingFace.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Модель для генерации 3D от Stability AI

🆕 Разработчики Stable Diffusion показали Stable Video 3D — новую нейросеть, которая создает 3D-объекты по одному изображению.

🎞 Stable Video 3D работает на основе недавно выпущенной Stable Video Diffusion — модели для генерации видео.

🫡 Новая нейросеть выходит в двух вариантах — с возможностью контролировать местоположение виртуальной камеры и без нее.

🌀 Создатели обещают качественные генерации, которые можно вертеть и рассматривать с любого ракурса.

🛍 Будущее своей нейросети Stability AI видят в гейминге и e-commerce.

Некоммерческая версия Stable Video 3D лежит на Hugging Face, коммерческая — доступна только подписчикам Stability AI Membership.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53
🤑 Экс-CTO Amazon придумал чат-ботов, которые помогут заработать писателям и ютуберам

💡 Джозеф Сирош, который отвечал за ИИ-направления в Microsoft и Amazon, придумал новый стартап — CreatorsAGI.

🤝 Сервис компании поможет создавать ИИ-агентов, которые будут обеспечивать дополнительным заработком контентмейкеров, писателей, продюсеров и т. д.

Например, писатель может обучить ИИ-помощника на своих произведениях, после чего ассистент будет за деньги обучать всех желающих писательскому мастерству.

🔄 Контент для обучения можно обновлять и добавлять.

👻 Еще один вариант использования помощника — гострайтинг. Предполагается, что ИИ, обученный на авторском контенте, более точно сможет развить писательскую идею.

😳 Еще один пример: фанат автора сможет сгенерировать продолжение его любимого произведения, не дожидаясь «настоящей» книги.

Сирош считает, что его сервис принципиально отличается от кастомных чат-ботов, так как дает возможность «аутентичного генеративного взаимодействия» с любимым автором 🫡.

Сервис еще не запущен, условия монетизации тоже пока не раскрываются.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
Media is too big
VIEW IN TELEGRAM
💬 Ubisoft показали свое ПО для создания умных NPC

Разработчики Assassin’s Creed на Games Developers Conference (GDC) представили NEO NPC — совместный проект R&D-команды Ubisoft, Nvidia и компании Inworld.

☝️ NEO NPC использует модель Audio2Face от Nvidia, которая генерирует лицевую анимацию и липсинк по аудиоинформации. От Inworld модели досталась LLM — она позволяет неигровому персонажу реагировать на речь игрока и отвечать ему.

🦸 При этом языковая модель, как утверждается, не просто генерирует подходящие ответы, а учитывает, что это за NPC: его предысторию, характер и т. д.

Nvidia уже показывала аналогичный сольный проект.

Журналист The Verge смог попробовать прототип NEO NPC на GDC — результат можно оценить в клипе ☝️. Полная 15-минутная версия видео здесь.

📆 Ubisoft планируют использовать NEO NPC и в AAA-тайтлах и на небольших проектах, но признают, что произойдет это не скоро.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Neuralink показал игру в шахматы силой мысли

Компания Илона Маска опубликовала первое видео, где пациент по имени Ноланд Арбо с вживленным в мозг нейрочипом играет в онлайн-шахматы .

Ноланд сыграл в шахматы, передвигая компьютерный курсор с помощью импланта, во время стрима в соцсети X.

По словам Арбо, использование нейрочипа интуитивно и похоже на использование Силы в «Звездных войнах» — ему достаточно посмотреть в любую точку на экране и курсор переместится туда 👁.

🎮 Пациент рассказал, что чип также позволил ему 8 часов подряд играть в «Цивилизацию», отвлекаясь только на зарядку устройства.

29-летнего Арбо полностью парализовало ниже плеч после ДТП 8 лет назад. В конце января ему вживили чип Neuralink.

🔩 Арбо признал, что устройство еще надо дорабатывать, а команда Neuralink столкнулась с некоторыми сложностями. Подробностей он не раскрыл, но добавил, что чип «изменил его жизнь».

Neuralink далеко не первые, кому удается достичь подобных результатов.

Например, еще прошлым летом пациент с боковым амиотрофическим склерозом с помощью нейрочипа от стартапа Synchron смог управлять компьютером. Но у Synchron нет своего Илона Маска, который смог бы обеспечить стартапу нужный уровень хайпа 😘.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
🔈 Rolling Stone выпустил материал о нейросети для генерации музыки Suno. Самое интересное из текста

Suno за последнее время превратился в ИИ для создания музыки, который у всех на слуху. Нейросеть умеет генерировать не только мелодию и ритм, но и готовый текст с вокалом. Журнал Rolling Stone рассказывает о том, как появился и куда движется «ChatGPT для музыки».

📆 Suno в 2022 году основали четверо коллег-экспертов по машинному обучению, работавших в компании Kensho Technologies: Майк Шульман, Кинан Фрейберг, Георг Каксо и Мартин Камачо. В Kensho они разрабатывали сервис для саммарайзинга деловых созвонов.

🦻 Изначально основатели Suno не планировали делать музыкальную нейросеть. Первыми идеями был сервис для слабослышащих и программа, которая может определить неисправное оборудование по звуку. Но в итоге их первым продуктом стала Text-to-Speech нейросеть Bark. После нее появилась идея генератора музыки.

👥 Сейчас в компании работают 12 человек, часть из них — профессиональные музыканты.

🎧 Создателям Suno не нравится дисбаланс, когда тех, кто создает музыку, во много раз меньше, чем тех, кто ее слушает. С помощью нейросети они хотят изменить ситуацию и привлечь еще «миллиард» пользователей к созданию музыки.

🗣 В будущем стартап хочет отойти от модели генерации музыки по промптам. Один из вариантов — создание треков на основе пения пользователя.

🧠 Suno не раскрывают, на какой информации они обучают нейросеть. Основатели стартапа утверждают, что ведут переговоры с крупными звукозаписывающими компаниями и безмерно уважают и самих музыкантов, и их авторские права. При этом они допускают, что им может прилететь иск из-за их разработки.

🆕 21 марта вышла третья версия Suno, которая может создавать двухминутные треки на разных языках. Попробовать можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👏3👍2😢1
6
Apple хочет использовать ИИ Google в новых айфонах, Nvidia представила самый мощный в мире ИИ-чип, Альтман назвал GPT-4 отстоем — и другие важные новости за прошедшую неделю

Apple ведет переговоры с Google об использовании ИИ-модели Gemini. По всей видимости, гугловская нейросеть может появиться в новой версии iOS, которая выйдет осенью. ИИ, который разрабатывает сам Apple, все еще недостаточно хорош, чтобы работать в устройствах компании. Apple также вел переговоры с OpenAI о возможности лицензирования их нейросетей. Стороны пока не согласовали условия использования Gemini в устройствах Apple;

Разработчики жалуются на отсутствие поддержки GPT Store со стороны OpenAI. Якобы спустя несколько месяцев после запуска у магазина чат-ботов мало пользователей, при этом OpenAI не дает инструментов, чтобы поведение этих пользователей можно было проанализировать. Плюс (а точнее минус), GPT Store все еще доступен только для платных пользователей, у него до сих пор нет монетизации. В то же время у маркетплейса постепенно появляются конкуренты, привлекательные для инвесторов;

YouTube обязал авторов отчитываться об использовании «реалистично выглядящего» генеративного контента. После того как автор сообщит о нем, платформа промаркирует контент для зрителя. При этом «нереалистичный» ИИ-контент разрешают не маркировать. По каким критериям будут оценивать реалистичность, не уточняется. Авторов, которые проигнорируют нововведение, могут забанить на платформе или удалить видео;

Sony поставила на паузу производство хедсета PSVR 2, так как не смогла реализовать уже выпущенные устройства. Из двух млн устройств продано только 1,7 млн штук. PSVR поступил в продажу в феврале 2023 года по цене $550. Одной из причин относительного провала может быть небольшое количество контента для девайса. Ранее стало известно и об увольнениях в студиях, которые занимались созданием игр для PSVR;

Nvidia представила Blackwell B200 — «самый мощный в мире чип», созданный специально для запуска ИИ. В компании утверждают, что B200 позволит сократить энергопотребление и снизить стоимость работы ИИ-моделей до 25 раз (по сравнению с предыдущим чипом H100). На обучение модели уровня GPT-4 с помощью B200 потребуется в четыре раза меньше времени, чем с GPU предыдущего поколения;

Сэм Альтман заявил, что GPT-4 на сегодняшний момент можно считать «отстоем». По словам главы OpenAI, по сравнению с грядущей GPT-5, текущая модель LLM кажется примитивной и устаревшей. Но, уточнил Альтман, такая же ситуация была и с GPT-3, когда готовилась к выходу четвертая версия;

Один из основателей Deep Mind Мустафа Сулейман стал главой потребительского ИИ-подразделения Microsoft. Он, в частности, будет отвечать за интеграцию ИИ в Windows и поисковик Bing. Вместе с собой Сулейман привел коллег из своего стартапа Inflection, который считается конкурентом OpenAI;

Власти Франции выписали Google штраф на €250 млн за нелегальное использование контента нескольких французских изданий при обучении ИИ-модели Gemini. Google пообещал оспорить решение;

Google выложил в открытый доступ для тестирования самую мощную модель из семейства Gemini — Pro. Из России тоже доступно, но придется поиграться с регионом;

Глава правительства Италии Джорджа Мелони потребовала компенсацию с авторов дипфейкового порно, в котором использовали ее образ. Мелони хочет получить €100 тыс.. В создании и распространении синтетического порно обвиняют 40-летнего мужчину и его 73-летнего отца
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 В MIT придумали способ ускорить нейросети в 30 раз

Исследователи института разработали фреймворк Distribution Matching Distillation (DMD), который позволяет существенно ускорить работу существующих диффузионных нейросетей. Ускорение достигается за счет «превращения» сложной диффузионной модели в компактный генератор изображений.

DMD сокращает несколько десятков этапов генерации картинки до одного. Качество генерации при этом, как утверждает MIT, не страдает, а иногда даже превосходит изображения, созданные «полным циклом». На изображение, которое Stable Diffusion генерирует за 2,6 сек., у DMD уходит 0,09 сек.

👩‍🏫 Достигается это за счет того, что DMD использует модель «учитель-ученик», где учитель — это сложная диффузионная модель, а ученик — простая модель, от которой требуется выполнение одной задачи — генерации изображения.

🔨 Ученик копирует принципы работы учителя, но беспощадно их оптимизирует, используя только самые необходимые механизмы. DMD смотрит на пример генерации сложной нейросети и пытается точно повторить его, сравнивая «похожесть» с помощью встроенного бенчмарка.

☹️ Главный минус DMD в том, что фреймворк получает и все слабые места нейросети, которую он копирует. Например, неспособность сгенерировать текст.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42🤔2
🔨 Sora дали потестировать профессиональным дизайнерам и художникам. Вот что получилось

В блоге OpenAI появились несколько роликов, созданных с помощью Sora художниками, 3D-дизайнерами, креативными студиями и продакшн-компаниями.

💬 В посте есть цитаты тестировщиков об опыте взаимодействия с нейросетью — естественно, все они в восторге и продвигают важный для OpenAI нарратив, что Sora не заменит креативщиков, а станет им верным помощником.

🎞 Опубликованные ролики варьируются от полных абстракций до передачи «В мире животных» из параллельной вселенной и истории мужчины с воздушным шариком на месте головы.

😱 Да, генерации Sora все еще выглядят потрясающе.

📆 Модель должна стать доступна всем желающим до конца года. По слухам, компания уже продвигает свою нейросеть в Голливуде.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7