Media is too big
VIEW IN TELEGRAM
Сервис, который сгенерирует эпизод South Park с вами в главной роли 🎬
Стартап из Сан-Франциско Fable показал сервис Showrunner AI, который с помощью ИИ может с нуля сгенерировать эпизод «Южного парка» с вами в роли одного из персонажей. Для этого в программу нужно загрузить свое фото 📷.
☝️ Новинка может буквально все: написать сценарий, озвучить и анимировать героев, смонтировать эпизод. Программа может создать эпизод по собственному сценарию или использовать текстовую подсказку из пары предложений.
Видео выше — пример работы Showrunner AI. Полностью 20-минутную серию можно посмотреть здесь.
🚨 Чтобы избежать юридических проблем, Fable не собирается выпускать Showrunner AI для бесплатного или коммерческого использования. По словам разработчиков, вместо этого они ведут переговоры с другими командами для создания оригинальных IP с помощью сервиса.
😐 Журналисты, которым удалось посмотреть модель в действии, нашли у нее множество косяков (скажем, шутки не дотягивают по уровню даже до самых слабых эпизодов «Парка»). Но мало кто считает это большой проблемой, учитывая темпы развития ИИ-алгоритмов.
Стартап из Сан-Франциско Fable показал сервис Showrunner AI, который с помощью ИИ может с нуля сгенерировать эпизод «Южного парка» с вами в роли одного из персонажей. Для этого в программу нужно загрузить свое фото 📷.
Видео выше — пример работы Showrunner AI. Полностью 20-минутную серию можно посмотреть здесь.
🚨 Чтобы избежать юридических проблем, Fable не собирается выпускать Showrunner AI для бесплатного или коммерческого использования. По словам разработчиков, вместо этого они ведут переговоры с другими командами для создания оригинальных IP с помощью сервиса.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤯2👍1
Дипфейки внедрят вам воспоминания о том, чего никогда не существовало 🤯
Это выяснилось в результате эксперимента, который провели в Университетском колледже Корка в Ирландии.
🎞 Исследователи показали 400 участникам дипфейк-видео и текстовые описания фильмов-ремейков, которые никогда не снимали. Например, «Капитан Марвел» с Шарлиз Терон в главной роли или «Сияние» с Брэдом Питтом и Анджелиной Джоли. В подборке также были видео из реально существующих фильмов.
Каждому участнику эксперимента показывали 4 настоящие кинокартины и 2 фейковые.
🤨 По итогу 75% процентов заявили, что слышали о ремейке «Капитана Марвел» с Терон, а 40% были уверены, что все фильмы-фейки, о которых им сказали, существуют в реальности.
Интересно, что количество поверивших в существование фейковых фильмов практически не менялось в зависимости от того, показывали им дипфейки или просто зачитали описание фильма. Некоторые даже говорили, что ремейк (которого на самом деле не существует) понравился им больше, чем оригинал 😮.
Это выяснилось в результате эксперимента, который провели в Университетском колледже Корка в Ирландии.
🎞 Исследователи показали 400 участникам дипфейк-видео и текстовые описания фильмов-ремейков, которые никогда не снимали. Например, «Капитан Марвел» с Шарлиз Терон в главной роли или «Сияние» с Брэдом Питтом и Анджелиной Джоли. В подборке также были видео из реально существующих фильмов.
Каждому участнику эксперимента показывали 4 настоящие кинокартины и 2 фейковые.
Интересно, что количество поверивших в существование фейковых фильмов практически не менялось в зависимости от того, показывали им дипфейки или просто зачитали описание фильма. Некоторые даже говорили, что ремейк (которого на самом деле не существует) понравился им больше, чем оригинал 😮.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Посмотрите, как Midjourney и GEN-2 работают вместе 🤝
Идея простая: Midjourney генерирует картинки, а GEN-2 их анимирует.
Завораживающий ролик выложил пользователь Creative.Edge в соцсети X, ранее известной как Twitter 🤦♀️.
Возможность анимировать загруженные пользователем статичные изображения появилась в GEN-2 совсем недавно. Потестировать может любой, но понадобится регистрация 📄.
Идея простая: Midjourney генерирует картинки, а GEN-2 их анимирует.
Завораживающий ролик выложил пользователь Creative.Edge в соцсети X, ранее известной как Twitter 🤦♀️.
Возможность анимировать загруженные пользователем статичные изображения появилась в GEN-2 совсем недавно. Потестировать может любой, но понадобится регистрация 📄.
👍6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
📸 Фотокамера со встроенной Stable Diffusion
Продакт дизайнер Snapchat Кайл Гудрич показал DreamGenerator — прототип фотоаппарата с интегрированной нейросетью Stable Diffusion в связке с ControlNet 🔗.
Для удобства пользователя в DreamGenerator есть 30 промптов-пресетов (ретро, сказка, зомби и т. д.), которые помогают быстро отредактировать только что сделанное фото 🖼.
🫰 Гудрич говорит, что его целью было максимально упростить работу с нейросетью и текстовыми подсказками, поэтому о технической начинке камеры он думал в последнюю очередь.
Коммерческий релиз камеры Гудрич не планирует.
🌍 Похожую на DreamGenerator камеру уже показывали весной. Paragraphica тоже работает на Stable Diffusion, но сгенерированные фото привязаны к местонахождению пользователя, которое девайс самостоятельно геолоцирует.
Продакт дизайнер Snapchat Кайл Гудрич показал DreamGenerator — прототип фотоаппарата с интегрированной нейросетью Stable Diffusion в связке с ControlNet 🔗.
Для удобства пользователя в DreamGenerator есть 30 промптов-пресетов (ретро, сказка, зомби и т. д.), которые помогают быстро отредактировать только что сделанное фото 🖼.
🫰 Гудрич говорит, что его целью было максимально упростить работу с нейросетью и текстовыми подсказками, поэтому о технической начинке камеры он думал в последнюю очередь.
Коммерческий релиз камеры Гудрич не планирует.
🌍 Похожую на DreamGenerator камеру уже показывали весной. Paragraphica тоже работает на Stable Diffusion, но сгенерированные фото привязаны к местонахождению пользователя, которое девайс самостоятельно геолоцирует.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Нейромиксер для изображений 🥘
✨ Сайт Artbreeder — ветеран в деле художественного редактирования картинок — запустил функцию Mixer, которая позволяет с помощью нейросети объединять между собой изображения.
✍️ Результат потом легко отредактировать промптом.
Попробовать можно здесь.
✍️ Результат потом легко отредактировать промптом.
Попробовать можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
👨🔬 Ученые из MIT и Калифорнийского университета обучили языковую модель работе с 3-мерными объектами. Нейросеть анализирует 3D-объект и может сгенерировать к нему описание, помочь с навигацией, ответить на вопросы, разработать алгоритм для выполнения задачи в пределах такой модели.
📹 На видео — пример работы такой LLM. Пользователь спрашивает, есть ли в 3-мерной модели комнаты что-то, чем можно погладить одежду, а нейросеть отвечает: да, есть утюг, он около вешалки. 👕
Авторы исследования отмечают: современным языковым моделям недостает навыков работы с 3-мерным миром: понимания, как объекты располагаются в пространстве относительно друг друга и как они могут взаимодействовать. Новые LLM закроют эти недостатки. 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Гигантская Барби вышла из коробки в Дубае
🏛 Ролик снят рядом с Бурдж-Халифа, самым высоким зданием в мире. В глазах зрителя Барби не сильно уступает зданию по высоте. Внешний вид Барби — полосатый купальник, прическа, солнечные очки — очень похож на то, как выглядела самая 1-я кукла этого бренда в 1959 году🩱.
Видео создало креативное агентство Eye Studio — естественно, к мировой премьере фильма про Барби. За 4 дня его посмотрели 3 млн раз. Хотя зрители разошлись в оценках — многие пишут, что словили бы сердечный приступ, увидев такое в реальной жизни😱.
🏛 Ролик снят рядом с Бурдж-Халифа, самым высоким зданием в мире. В глазах зрителя Барби не сильно уступает зданию по высоте. Внешний вид Барби — полосатый купальник, прическа, солнечные очки — очень похож на то, как выглядела самая 1-я кукла этого бренда в 1959 году🩱.
Видео создало креативное агентство Eye Studio — естественно, к мировой премьере фильма про Барби. За 4 дня его посмотрели 3 млн раз. Хотя зрители разошлись в оценках — многие пишут, что словили бы сердечный приступ, увидев такое в реальной жизни😱.
🤔5
Как Spotify собирается внедрять ИИ в сервис
Планами на ИИ-будущее крупнейшего музыкального стриминга поделился СЕО Spotify Дэниэль Эк на звонке с инвесторами. Вот что он рассказал:
✍️ Spotify запустит саммарайзинг подкастов. По задумке — слушателям так будет легче знакомиться с новыми подкастами, что приведет только к усилению взаимодействия (а не к отказу от подкаста в пользу саммари).
🔊 Аудиорекламу будет генерировать ИИ. Рекламодатели смогут запускать множество разных вариантов объявлений и тестировать их в рекламной сети Spotify.
📲 Еще Дэниэль Эк пообещал более активно использовать ИИ для более глубокой персонализации всего сервиса — тут пока без конкретики.
У Spotify уже есть ИИ-продукт, который в компании считают успешным — это виртуальный диджей, который подбирает треки и комментирует их как радиоведущий. Дэниэль Эк заявил, что подписчики сервиса очень активно пользуются услугами виртуального диджея, хотя конкретных чисел не назвал. 💿
TechCrunch предполагает, что Дэниэль Эк раскрыл еще не все карты. В прошлом году Spotify приобрел стартап по синтезу голосов Sonantic, а сейчас подал заявку на патент text-to-speech системы, которая может передавать эмоции. Возможно, Spotify возьмется, например, за озвучку аудиокниг с помощью ИИ. 📖
Планами на ИИ-будущее крупнейшего музыкального стриминга поделился СЕО Spotify Дэниэль Эк на звонке с инвесторами. Вот что он рассказал:
✍️ Spotify запустит саммарайзинг подкастов. По задумке — слушателям так будет легче знакомиться с новыми подкастами, что приведет только к усилению взаимодействия (а не к отказу от подкаста в пользу саммари).
🔊 Аудиорекламу будет генерировать ИИ. Рекламодатели смогут запускать множество разных вариантов объявлений и тестировать их в рекламной сети Spotify.
📲 Еще Дэниэль Эк пообещал более активно использовать ИИ для более глубокой персонализации всего сервиса — тут пока без конкретики.
У Spotify уже есть ИИ-продукт, который в компании считают успешным — это виртуальный диджей, который подбирает треки и комментирует их как радиоведущий. Дэниэль Эк заявил, что подписчики сервиса очень активно пользуются услугами виртуального диджея, хотя конкретных чисел не назвал. 💿
TechCrunch предполагает, что Дэниэль Эк раскрыл еще не все карты. В прошлом году Spotify приобрел стартап по синтезу голосов Sonantic, а сейчас подал заявку на патент text-to-speech системы, которая может передавать эмоции. Возможно, Spotify возьмется, например, за озвучку аудиокниг с помощью ИИ. 📖
❤7
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть, которая поможет обставить квартиру
🛋 Она называется Decorify, ее запускает американский онлайн-магазин мебели Wayfair. Пользователь загружает в приложение фотографию своей квартиры и задает желаемый стиль интерьера, а Decorify предлагает на выбор несколько вариантов нового дизайна. 🖼
Что интересно, Decorify обставляет комнату предметами, которые есть в продаже на Wayfair. Пользователь может заказать понравившуюся мебель прямо из интерфейса Decorify — элементы интерьера в генерациях кликабельны и ведут в онлайн-магазин.🛒
🛋 Она называется Decorify, ее запускает американский онлайн-магазин мебели Wayfair. Пользователь загружает в приложение фотографию своей квартиры и задает желаемый стиль интерьера, а Decorify предлагает на выбор несколько вариантов нового дизайна. 🖼
Что интересно, Decorify обставляет комнату предметами, которые есть в продаже на Wayfair. Пользователь может заказать понравившуюся мебель прямо из интерфейса Decorify — элементы интерьера в генерациях кликабельны и ведут в онлайн-магазин.🛒
👍2
Вышла новая версия Stable Diffusion, Meta* потеряла на метавселенных и VR еще $3,7 млрд за квартал — и другие важные новости за неделю
✅ В семействе чат-ботов Microsoft может появиться пополнение. LinkedIn работает над своим ИИ чат-ботом, который будет помогать с поиском работы, обучением и расширением нетворка;
✅ OpenAI поддержало выдачу лицензий на разработку продвинутых ИИ. Компания говорит, что так регуляторам будет проще отслеживать новых участников рынка. Критики уверены: так OpenAI защищается от будущей конкуренции со стартапами и open source-моделями;
✅ Anthropic, Google, Microsoft и OpenAI запускают Frontier Model Forum — некоммерческую организацию для регулирования работы ИИ. Интересно, что Meta* или Amazon в их организации нет;
✅ У ChatGPT появилось приложение для Android: на этой неделе оно вышло для США, Индии, Бангладеша и Бразилии. Список стран постепенно будут расширять;
✅ А чат-бот Bing, который ранее работал эксклюзивно в браузере Microsoft Edge, станет доступен в браузерах Chrome и Safari в виде расширений. Но для Chrome лимиты на число сообщений и длину реплик в Bing Chat ниже, чем в Edge;
✅ Тинькофф запустил алгоритм Саундтрат, который превращает расходы пользователей в музыку. Саундтрат анализирует, сколько, в какое время суток, в каких категориях клиент платил чаще. На основе этого алгоритм выбирает музыкальные эффекты, из которых генерирует трек;
✅ Meta* потратила на VR и метавселенную еще $3,7 млрд за квартал. Всего убытки подразделения Reality Lab достигли уже $21 млрд. Останавливаться Цукерберг пока не намерен;
✅ Amazon запустила Agents for Bedrock, набор инструментов для создания ИИ-приложений, которые смогут выполнять задачи самостоятельно. Фактически, Amazon занимает роль конструктора в ИИ-гонке;
✅ Stability AI выпустила Stable Diffusion XL 1.0 — новую версию своей text2image нейросети. Stable Diffusion XL 1.0 дает более яркие и точные цвета, менее требовательна к вычислительным мощностям;
✅ Samsung рассказал, что готовит к запуску свой генеративный ИИ, который «поселится» в смартфонах, планшетах, умных часах и даже наушниках. Ранее было известно, что Samsung разрабатывает внутренний аналог ChatGPT, но для нужд сотрудников (которым запретил пользоваться ChatGPT).
*Организация, запрещенная на территории РФ
✅ В семействе чат-ботов Microsoft может появиться пополнение. LinkedIn работает над своим ИИ чат-ботом, который будет помогать с поиском работы, обучением и расширением нетворка;
✅ OpenAI поддержало выдачу лицензий на разработку продвинутых ИИ. Компания говорит, что так регуляторам будет проще отслеживать новых участников рынка. Критики уверены: так OpenAI защищается от будущей конкуренции со стартапами и open source-моделями;
✅ Anthropic, Google, Microsoft и OpenAI запускают Frontier Model Forum — некоммерческую организацию для регулирования работы ИИ. Интересно, что Meta* или Amazon в их организации нет;
✅ У ChatGPT появилось приложение для Android: на этой неделе оно вышло для США, Индии, Бангладеша и Бразилии. Список стран постепенно будут расширять;
✅ А чат-бот Bing, который ранее работал эксклюзивно в браузере Microsoft Edge, станет доступен в браузерах Chrome и Safari в виде расширений. Но для Chrome лимиты на число сообщений и длину реплик в Bing Chat ниже, чем в Edge;
✅ Тинькофф запустил алгоритм Саундтрат, который превращает расходы пользователей в музыку. Саундтрат анализирует, сколько, в какое время суток, в каких категориях клиент платил чаще. На основе этого алгоритм выбирает музыкальные эффекты, из которых генерирует трек;
✅ Meta* потратила на VR и метавселенную еще $3,7 млрд за квартал. Всего убытки подразделения Reality Lab достигли уже $21 млрд. Останавливаться Цукерберг пока не намерен;
✅ Amazon запустила Agents for Bedrock, набор инструментов для создания ИИ-приложений, которые смогут выполнять задачи самостоятельно. Фактически, Amazon занимает роль конструктора в ИИ-гонке;
✅ Stability AI выпустила Stable Diffusion XL 1.0 — новую версию своей text2image нейросети. Stable Diffusion XL 1.0 дает более яркие и точные цвета, менее требовательна к вычислительным мощностям;
✅ Samsung рассказал, что готовит к запуску свой генеративный ИИ, который «поселится» в смартфонах, планшетах, умных часах и даже наушниках. Ранее было известно, что Samsung разрабатывает внутренний аналог ChatGPT, но для нужд сотрудников (которым запретил пользоваться ChatGPT).
*Организация, запрещенная на территории РФ
👍3
Media is too big
VIEW IN TELEGRAM
Новый конкурент GEN — на этот раз из Израиля 🇮🇱
TokenFlow, как и модель Runway, может редактировать исходное видео по промпту. Но разработчики особенно гордятся тем, насколько консистентным получается результат😱 .
Если верить видео, то сгенерированные клипы действительно получаются очень плавными и почти не дергаются в припадке, как это бывает у аналогичных моделей🙂 .
TokenFlow, как утверждают авторы, эффективно работает с любым text2image-методом и не требует дополнительных обучения и настройки 📚.
Попробовать пока нельзя, но разработчики обещают выложить код в ближайшее время.
TokenFlow, как и модель Runway, может редактировать исходное видео по промпту. Но разработчики особенно гордятся тем, насколько консистентным получается результат
Если верить видео, то сгенерированные клипы действительно получаются очень плавными и почти не дергаются в припадке, как это бывает у аналогичных моделей
TokenFlow, как утверждают авторы, эффективно работает с любым text2image-методом и не требует дополнительных обучения и настройки 📚.
Попробовать пока нельзя, но разработчики обещают выложить код в ближайшее время.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Приложение от создателей Instagram* зачитает новости голосом Снуп Догга 🎙
👂 В новостной агрегатор Artifact (подробнее о нем здесь) интегрировали text2speech-сервис Speechify. Теперь новости можно не только почитать, но и послушать — в исполнении Снуп Догга, Гвинет Пэлтроу и еще 30+ синтетических голосов.
🍏 Пока обновление доступно только в iOS-приложении, но скоро обещают и на Android.
🫤 Те, кто успел попробовать обновление, говорят, что синтетические голоса в Artifact страдают всеми стандартными болезнями: монотонность, неправильные интонации, ошибки в ударении и т. д.
Разработчики Artifact вообще активно добавляют в приложение ИИ-возможности. Например, в июне агрегатор научился переписывать кликбейтные новостные заголовки с помощью GPT-4 📰.
ИИ-алгоритмы также помогают пользователю найти новости на интересующие его темы, а встроенный в Artifact чат-бот может пересказать новость за пару предложений.
*Instagram входит в Meta — организацию, запрещенную на территории РФ
👂 В новостной агрегатор Artifact (подробнее о нем здесь) интегрировали text2speech-сервис Speechify. Теперь новости можно не только почитать, но и послушать — в исполнении Снуп Догга, Гвинет Пэлтроу и еще 30+ синтетических голосов.
🍏 Пока обновление доступно только в iOS-приложении, но скоро обещают и на Android.
🫤 Те, кто успел попробовать обновление, говорят, что синтетические голоса в Artifact страдают всеми стандартными болезнями: монотонность, неправильные интонации, ошибки в ударении и т. д.
Разработчики Artifact вообще активно добавляют в приложение ИИ-возможности. Например, в июне агрегатор научился переписывать кликбейтные новостные заголовки с помощью GPT-4 📰.
ИИ-алгоритмы также помогают пользователю найти новости на интересующие его темы, а встроенный в Artifact чат-бот может пересказать новость за пару предложений.
*Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2
Media is too big
VIEW IN TELEGRAM
VideoControlNet — для тех, кто хочет контролировать создание нейровидео
🕓 Video-to-Video и Text-to-Video-модели типа GEN прогрессируют не по дням, а по часам, но результаты их работы все еще нестабильны — сгенерированные клипы часто получаются дергаными, а милый щенок из 1-го кадра уже в следующем превращается в монстра (самые адовые примеры можно посмотреть тут).
🇭🇰 На помощь приходят исследователи из Гонконга, которые придумали VideoControlNet — аналог популярного ControlNet, но для видеогенераций.
🎞 Принцип работы VideoControlNet вдохновлен видеокодеками (известными всем mkv, avi и другими), которые сжимают исходное видео, стараясь сохранить исходное качество.
🧹 Схожим образом VideoControlNet оптимизирует видеогенерацию, убирая из нее лишнюю информацию, которая появляется в результате работы нейросети. В итоге получается консистентный клип.
Пока авторы поделились только готовыми примерами работы модели, но скоро обещают выложить код, чтобы все могли ее попробовать.
🕓 Video-to-Video и Text-to-Video-модели типа GEN прогрессируют не по дням, а по часам, но результаты их работы все еще нестабильны — сгенерированные клипы часто получаются дергаными, а милый щенок из 1-го кадра уже в следующем превращается в монстра (самые адовые примеры можно посмотреть тут).
🇭🇰 На помощь приходят исследователи из Гонконга, которые придумали VideoControlNet — аналог популярного ControlNet, но для видеогенераций.
🎞 Принцип работы VideoControlNet вдохновлен видеокодеками (известными всем mkv, avi и другими), которые сжимают исходное видео, стараясь сохранить исходное качество.
🧹 Схожим образом VideoControlNet оптимизирует видеогенерацию, убирая из нее лишнюю информацию, которая появляется в результате работы нейросети. В итоге получается консистентный клип.
Пока авторы поделились только готовыми примерами работы модели, но скоро обещают выложить код, чтобы все могли ее попробовать.
🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Модель компании Devar позволяет создавать ассеты по текстовой подсказке, а затем использовать их в приложениях на iOS и Android.
☁️ Нейронка интегрирована в платформу, разработанную компанией, которая объединяет другие ИИ-модели и облачные сервисы для создания разного AR-контента.
Разработчики утверждают, что хорошо поработали над оптимизацией нейросети, что позволяет работать с генерациями даже на бюджетных смартфонах ☎️.
Если захотелось попробовать сервис, то сначала нужно будет зарегистрироваться на платформе MyWebAR.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
👩🚀 У NASA будет свой стриминг-сервис
NASA+ будет бесплатной платформой, на которой появятся документальные передачи о работе космического агентства. Контент будет как архивным, так и совсем новым, снятым специально для NASA+.
📺 Сейчас для этих целей у агентства есть канал NASA TV, но выглядит он по меркам 2023 года совсем уж устаревшим.
🌐 Вместе с запуском стриминга, агентство перезапустит свой сайт (сейчас доступен в бете) и обновит мобильное приложение. Через сайт и приложение будет доступен и стриминг-сервис.
Запуск NASA+ состоится «позже этим летом».
NASA+ будет бесплатной платформой, на которой появятся документальные передачи о работе космического агентства. Контент будет как архивным, так и совсем новым, снятым специально для NASA+.
📺 Сейчас для этих целей у агентства есть канал NASA TV, но выглядит он по меркам 2023 года совсем уж устаревшим.
Запуск NASA+ состоится «позже этим летом».
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Text-to-Video-модель Pika Labs стала доступна для всех
🥱 Если вам уже наскучили модели для генерации видео по промпту, о которых мы писали до этого, то вот вам новичок. Pika Labs находится на этапе открытого тестирования и бесплатно доступна через Discord.
☝️ Количество генераций ограничено 10 изображениями за 5 минут. Модель также позволяет анимировать готовые картинки.
Откровений не ждите, но выглядят генерации очень достойно👍 .
Подробнее про работу с сервисом можно почитать здесь.
🥱 Если вам уже наскучили модели для генерации видео по промпту, о которых мы писали до этого, то вот вам новичок. Pika Labs находится на этапе открытого тестирования и бесплатно доступна через Discord.
Откровений не ждите, но выглядят генерации очень достойно
Подробнее про работу с сервисом можно почитать здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Nvidia показала нейросеть, которая весит всего 100 кб
💾 Генеративка Perfusion мало того что помещается на дискету, так еще и время ее обучения составило всего 4 минуты. Та же Midjourney требует больше 2 гигабайт свободного места.
🔑 Добиться этого удалось благодаря механизму, который Nvidia назвала Key-Locking. Благодаря ему модель может «привязывать» конкретный запрос пользователя к общей категории (или суперкатегории).
😽 Например, если пользователь попросит сгенерировать кота, то модель приоритетно соотнесет запрос «кот» с суперкатегорией «семейство кошачьих», а затем начнет обрабатывать детали из текстовой подсказки. Такой способ повышает скорость работы алгоритма.
🤸 Гибкость модели позволяет настраивать ее под конкретный случай — когда пользователю нужно, чтобы Perfusion следовал максимально близко к текстовой подсказке, и когда модели можно дать «свободу творчества».
Так ли великолепно работает Perfusion на самом деле — сказать пока сложно. Код разработчики обещают опубликовать позже.
💾 Генеративка Perfusion мало того что помещается на дискету, так еще и время ее обучения составило всего 4 минуты. Та же Midjourney требует больше 2 гигабайт свободного места.
🔑 Добиться этого удалось благодаря механизму, который Nvidia назвала Key-Locking. Благодаря ему модель может «привязывать» конкретный запрос пользователя к общей категории (или суперкатегории).
😽 Например, если пользователь попросит сгенерировать кота, то модель приоритетно соотнесет запрос «кот» с суперкатегорией «семейство кошачьих», а затем начнет обрабатывать детали из текстовой подсказки. Такой способ повышает скорость работы алгоритма.
🤸 Гибкость модели позволяет настраивать ее под конкретный случай — когда пользователю нужно, чтобы Perfusion следовал максимально близко к текстовой подсказке, и когда модели можно дать «свободу творчества».
Так ли великолепно работает Perfusion на самом деле — сказать пока сложно. Код разработчики обещают опубликовать позже.
❤4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Meta* выпустила AudioCraft — аудиоинструмент сразу с 3-мя ИИ-моделями внутри ☝️
🎵 AudioCraft может генерировать музыку и аудио в высоком качестве по текстовой подсказке.
🛠 В основе инструмента лежат 3 модели: MusicGen (подробнее о ней тут), AudioGen и EnCodec. 1-я генерирует музыку, 2-я — остальной аудиоконтент, а EnCodec следит за тем, чтобы все это хорошо звучало.
🎹 Разработчики уверены, что их программа может стать революционным инструментом, каким когда-то стал синтезатор.
🧪 Meta* призывает всех экспериментировать с AudioCraft, поэтому на GitHub можно разжиться исходниками.
*Организация, запрещенная на территории РФ
🎵 AudioCraft может генерировать музыку и аудио в высоком качестве по текстовой подсказке.
🛠 В основе инструмента лежат 3 модели: MusicGen (подробнее о ней тут), AudioGen и EnCodec. 1-я генерирует музыку, 2-я — остальной аудиоконтент, а EnCodec следит за тем, чтобы все это хорошо звучало.
🎹 Разработчики уверены, что их программа может стать революционным инструментом, каким когда-то стал синтезатор.
🧪 Meta* призывает всех экспериментировать с AudioCraft, поэтому на GitHub можно разжиться исходниками.
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1