D. Lab

🤖

ИИ-чатбот может стать новой стартовой точкой для шопинга на Amazon

Журналисты Bloomberg обратили внимание на новые вакансии Amazon. Компания ищет разработчиков, которые помогут переосмыслить Amazon Search с помощью интерактивного разговорного опыта и перестроить поиск благодаря технологиям глубокого обучения.

💬 Это может означать, что Amazon планирует добавить поисковик в стиле Bing или Bard в свою ecom-платформу. В разговоре с чат-ботом пользователи смогут задавать вопросы о продукте, сравнивать товары между собой и получать персонализированные предложения.

🛒 Bing при поиске определенного товара сразу выдает список релевантных продуктов. ChatGPT поддерживает плагины, которые позволяют заказывать доставку в Instacart или бронировать рестораны в OpenTable — это тоже можно считать базой для внедрения e-commerce функций.

🔎 На Amazon все пока реализовано в виде поисковой строки, где пользователь тратит много времени на поиск подходящего товара среди множества рекламных предложений. Но более половины покупателей в США начинают искать товар сразу с главной страницы Amazon, а не в Google.

🙋‍♀️ Чат-бот позволит Amazon оставаться страницей, с которой пользователи начинают шопинг. Это изменит и сам процесс шопинга — он перейдет из формата поиска в формат диалога.

Please open Telegram to view this post

VIEW IN TELEGRAM

551 views15:37

D. Lab

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

🎧

K-pop артист с помощью ИИ поет на 6 языках

Медиагигант Hybe (стоит за успехом BTS и других корейских поп-звезд) представил новый музыкальный проект Midnatt — его лицом стал известный K-pop певец Ли Хен. Он выпустил дебютный сингл Masquerade сразу на 6 языках: корейском, английском, испанском, китайском, японском и вьетнамском. 💽

Ли Хен, конечно, не такой полиглот: петь на 6 языках ему помогли технологии голосового ИИ-стартапа Supertone. Hybe ранее приобрел эту компанию за $36 млн. 🎙

Смешивая с помощью Supertone голос певца и других людей, в Hybe сделали так, чтобы Ли Хен звучал как носитель каждого из 6 языков. А еще добавили в трек «женскую» версию голоса певца — ее можно услышать во 2-м куплете. 🔊

В Hybe стремятся больше использовать ИИ для генерации музыки. Основатель компании Бан Ши Хек считает, что в будущем искусственный интеллект потеснит артистов людей. 👨‍🎤

Недавно певица Граймс официально разрешила использовать свой голос для синтеза вокала к новым трекам. А вот лейблы Дрейка и The Weeknd добились удаления со стримингов фейковой песни с их голосами, синтезированными ИИ. ❌

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

565 views06:45

D. Lab

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

🧊

Spline AI помогает создавать 3D-объекты с помощью ИИ прямо в браузере

Spline AI — инструмент для создания 3D-объектов, анимаций и текстур с помощью текстовых промптов. Spline AI создан при помощи Open AI API и работает на базе сервиса 3D-дизайна Spline, который доступен в веб-версии 🖥.

Пользователь вбивает в строку описание объекта, который он хочет создать, а алгоритмы генерируют этот объект или редактируют уже созданный. Также ИИ может по промпту задать объектам нужную текстуру, анимацию, расположение или физику.

🗂 В Spline AI также можно редактировать объекты, загружать свои изображения и видео и работать в командах, создавая 3D-модели одновременно в режиме реального времени.

Пока инструмент доступен в альфа-версии, поэтому использовать его можно бесплатно. Но чтобы начать работать со Spline AI, нужно встать в лист ожидания📑.

Please open Telegram to view this post

VIEW IN TELEGRAM

694 views14:10

D. Lab

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 Tesla показала обновленных человекоподобных роботов

Tesla представила человекоподобных роботов в октябре прошлого года, но тогда они едва ли могли перемещаться по сцене🚶.

Сейчас Оптимус может самостоятельно идти (хоть и медленно), перекладывать вещи из контейнера и разбивать яйца ногой 🍳.

Также в ролике показали, как робот ориентируется в пространстве благодаря технологиям ИИ, которые отслеживают местоположение объектов. Но судя по скорости ходьбы, пока что Оптимус не сможет далеко уйти 🗺.

Когда иду к маме рассказывать, что разбил ее любимую вазу

👍5

607 views11:30

D. Lab

This media is not supported in your browser

VIEW IN TELEGRAM

🚗 Meta* переносит AR в автомобили

Meta* и BMW подключили гарнитуру дополненной реальности к сенсорам автомобиля, определяющим его положение в пространстве. Это позволит реализовать поведение объектов дополненной реальности, соответствующее перемещению пользователя в пространстве.

*Организация, запрещенная на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3👍1

584 viewsedited 08:18

D. Lab

OpenAI и Stability AI выпустят модели с открытым исходным кодом, в ChatGPT появились плагины, Яндекс добавил в Алису YandexGPT — и другие важные новости за неделю

✅ Пользователи ChatGPT Plus получат доступ к 70 сторонним плагинам. С помощью одного из них чатбот может сам искать информацию в интернете — правда, медленно.

✅ OpenAI готовится выпустить свою первую языковую модель с открытым исходным кодом. Скорее всего система не будет конкурировать напрямую с ChatGPT.

✅ Zoom интегрирует ИИ-бота Anthropic в свою платформу. Чат-бот поможет Zoom эффективнее решать проблемы клиентов, которые обратились в службу поддержки.

✅ Пользователи iPhone смогут создать цифровую копию своего голоса. Для этого нужно будет сделать 15-минутную запись своего голоса и прочитать текстовые подсказки. Затем можно будет набирать сообщение, а ИИ будет читать его другим людям голосом пользователя. Инструмент предназначен для тех, кто может со временем потерять голос из-за развития определенных болезней.

✅ Яндекс разработал нейросеть YandexGPT и внедрил ее в голосового ассистента Алису. Нейросеть умеет выполнять творческие задачи, но пока что не запоминает контекст беседы.

✅ Stability AI выпускает новую версию приложения для генерации изображения из текста DreamStudio с открытым исходным кодом. Инструмент будет называться StableStudio и позволит разработчикам улучшать интерфейс приложения и экспериментировать с ним.

✅ OpenAI выпустила приложение ChatGPT для iOS. Приложение бесплатно и пока что доступно пользователям из США.

✅ ЕС согласовал поправки к законопроекту об ИИ. Производители моделей ИИ должны гарантировать безопасность пользователям, снижать энергопотребление и регистрировать свои системы в базе данных ЕС.

👍4

565 viewsedited 09:02

D. Lab

This media is not supported in your browser

VIEW IN TELEGRAM

DragGAN — самый удобный инструмент для редактирования изображений 👨‍🎨

↕️ Модель позволяет работать с фото при помощи обычного drag and drop: пользователь «хватает» нужную часть изображения и изменяет ее, перемещая курсор. Нейросеть при этом сохраняет корректные пропорции исходного изображения.

😺 В примере работы DragGan показано — как с помощью такой манипуляции можно легко закрыть глаза котику, поменять позу лошади, изменить выражение лица человека или сделать из одной модели авто другую. Можно представить, как пользователь сможет не только редактировать «настоящие» фото, но и сгенерированные нейросетью изображения, если его вдруг не устроили какие-то детали.

🛑 Сейчас работа модели серьезно ограничена: во-первых, пока что она недоступна обычным пользователям и существует в виде научной работы (код обещают в июне); во-вторых, редактировать можно только те объекты, на которых тренировали GAN-модель: животные, люди, автомобили и пейзажи. Во всех остальных случаях при «деформации» изображения могут возникать артефакты.

➕ В будущем авторы планируют добавить в DragGAN поддержку 3D-моделей.

🔥10

652 views10:00

D. Lab

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

👷 ИИ создаст из наброска детализированную сцену для VR

🌄 Разработчики из Blockade Labs представили новый инструмент Sketch Mode, интегрированный в платформу Skybox AI. С ее помощью можно создавать панорамы из обычных снимков, используя промпты, а затем использовать их в AR и VR.

✏️ Sketch Mode позволяет схематично набросать то, как будет выглядеть виртуальное пространство, а детали добавить с помощью текстовых подсказок — ИИ сделает все остальное. Дорабатывать результат можно, если поменять промпт или визуальный стиль.

Работает вся система на модифицированной версии Stable Diffusion.

Пока Sketch Mode доступен только на ПК и планшетах с большими экранами 🖥.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍1

637 views13:01

D. Lab

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

MinD-Video — детализированные видео, полученные напрямую из мозга 🧠

👀 Исследователи из университетов Гонконга и Сингапура представили новую модель, которая позволяет реконструировать видео, которое посмотрел человек во время МРТ. За визуализацию отвечает кастомная версия Stable Diffusion.

🎯 По словам авторов, их модель достигает точности в 85% в семантической классификации (то есть человек смотрел видео с котом и нейросеть реконструировала видео с котом) и показателя 0,19 по индексу структурного сходства (SSIM), который определяет схожесть 2-х изображений. Как утверждают авторы, это на 45% лучше, чем результаты аналогичных моделей конкурентов (о похожих моделях мы уже рассказывали) 💪.

🔋 Кроме того, создатели модели говорят, что MinD-Video может реконструировать и продолжительные видео с фреймрейтом в 30 fps при наличии достаточного объема видеопамяти (примеры выше сгенерированы с использованием одной видеокарты RTX3090).

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤯7😱1

544 views14:01

🤖 🖌 Adobe добавил в Photoshop генеративную нейросеть

В программе теперь есть инструмент Generative Fill, который позволяет быстро редактировать изображение с помощью промптов. На каждый промпт генерируется несколько вариантов, из которых можно выбрать. Работает новая система на собственной нейросети Firefly, которую Adobe выпустил этой весной 🔥.

Ключевое отличие Firefly от конкурентов в том, что нейросеть тренировали на стоковых изображениях сервиса Adobe Stock и контенте, который не был защищен копирайтом. Это позволяет авторам использовать результаты работы модели, не боясь получить повестку в суд 🚨.

📆 Generative Fill находится на этапе бета-версии, поэтому пользователи могут столкнуться с багами. Полноценный релиз состоится во второй половине года.

Те, кто уже успел потестировать новый инструмент, в целом хвалят его, но отмечают, что Firefly иногда крайне вольно обращается с инструкциями в текстовых подсказках и выдает что-то свое.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5

584 views10:01

D. Lab

1:23

This media is not supported in your browser

VIEW IN TELEGRAM

🕹ИИ будет управлять Windows 11

🤝 Microsoft интегрировал в операционную систему Copilot — ИИ-ассистента для взаимодействия с последней на сегодня Windows. Copilot уже используется в офисных приложениях Microsoft и браузере Edge.

Теперь управлять ОС можно будет, запустив из таскбара Copilot, который будет взаимодействовать со всеми приложениями. Ассистента можно будет использовать не только для продвинутого функционала типа саммарайзинга документов, но и базовых задач вроде copy-paste или смены обоев на рабочем столе 🫰.

Разработчики также обещают поддержку плагинов сторонних приложений, которые в марте анонсировали для ChatGPT.

☀️ Пилотный запуск Windows Copilot намечен на июнь, после чего всеми забытого ассистента Cortana, по всей видимости, окончательно отправят на свалку истории 😢. В Microsoft уже намекают, что в будущем системой Copilot можно будет управлять не только текстом, но и голосом.

🔥6👍2

565 views14:30

D. Lab

Ритейлер М.Видео показал виртуального амбассадора-сммщицу Эм.Ви ⌨️

Виртуальный аватар будет вести соцсети и блоги компании, записывать обзоры, а также проводить лайвстримы 📹.

Для создания Эм.Ви использовали технологию Motion Capture, за голос аватара будет отвечать неназванный голосовой ИИ, а за тексты, которые она произносит — GPT-подобная языковая модель 😛.

📅 На разработку Эм.Ви у М.Видео ушел почти год. В августе 2022 года компания начала поиск кандидатов на создание цифрового блогера. В качестве референсов тогда назывались актриса Зендея и певица Дора. В ТЗ также использовался образ виртуального блогера Лил Микелы.

В итоге над внешностью Эм.Ви. работала студия ITSALIVE, которая делала клип с 3D-Моргенштерном на Unreal Engine 5 🎤.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

596 views08:01

D. Lab

Spotify клонирует голоса ведущих подкастов

Синтетические версии хотят использовать в рекламных сообщениях, звучащих в перерывах выпусков. Перед тем как использовать голос, Spotify обещает получить разрешение от его владельца 👍.

🗣 О планах Spotify рассказал основатель сети подкастов The Ringer Билл Симмонс. The Ringer c 2020 года принадлежит Spotify.

🌍 По словам Симмонса, использование ИИ открывает новые рекламные возможности: например, можно записать сразу несколько вариантов рекламного сообщения, чтобы затем таргетировать его на определенную аудиторию. Еще 1 вариант — использовать синтетический голос ведущего для создания рекламы на разных языках.

😌 Симмонс замечтался и предположил, что ИИ также можно натренировать на всех выпусках шоу конкретного ведущего и тогда модель сама сможет не только озвучивать рекламу, но и автономно записывать новые выпуски шоу. Ведущие, вероятно, будут в восторге 🫤.

Официально Spotify не комментировал эти планы. Недавно мы рассказывали о стартапе Adthos, который предлагает за $50 в месяц синтезировать голоса для рекламы.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6

546 views11:01

D. Lab

Разработчик Warcraft и Diablo тренирует новую нейросеть на своих играх 🎮

Blizzard Entertainment обучает новую ИИ-модель на ассетах из собственных игр, чтобы быстрее генерировать концепт-арт (персонажей, вещи, пейзажи) для будущих проектов. Нейросеть получила название Blizzard Diffusion 😉.

Таким образом, компания хочет забрать часть рутинной работы у своих художников, чтобы использовать их для более творческих задач 🎨

Несмотря на весь потенциал нейросетей для геймдизайна, Blizzard уже отказывается от использования некоторых моделей. Речь идет, например, об ML-алгоритме, который должен был генерировать 3D-текстуры для виртуальных миров. Оказалось, что настройка модели занимает слишком много времени 🛠.

☝️ Тем не менее в Blizzard планируют в будущем использовать ИИ для генерации голосов, создания NPC, левел-дизайна и написания программного кода.

Над созданием игр с помощью нейросетей уже работают коллеги Blizzard из французской UbiSoft.

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡2🔥1

561 views15:01

Плагин для Unreal Engine, который сделает из обычных NPC — умных 🧠

🌏 Австралийцы из Replica Studios показали ИИ-плагин для игрового движка, позволяющего создавать NPC, которые реалистично реагируют на окружающий виртуальный мир.

«Статисты» теперь могут обстоятельно общаться друг с другом и игроком (для этого можно использовать микрофон), при этом выглядят не как клонированные болванчики, а как полноценные персонажи — с реалистичной анимацией и липсинком 👄.

Что-то подобное мы недавно видели в фанатском моде для Skyrim ⚔️.

🗣 За создание синтетических голосов отвечает модель собственной разработки Replica, за тексты — GPT, но разработчик может интегрировать и свою языковую модель. Плагин также позволяет для каждого NPC сгенерировать свою «биографию», что должно сделать их еще более правдоподобными.

📆 Демоверсию уже можно попробовать, а полноценная версия должна выйти до конца года.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5👏2🔥1

1.48K views11:00

D. Lab

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

Google научил Фламинго делать описания к видео на YouTube

🎞

🦩 Визуальную языковую модель Flamingo научили создавать описания для коротких видео Shorts.

ℹ️ Разработчики объяснили, что в отличие от длинных видео, Shorts сложнее найти через поиск из-за отсутствия нужной информации в описании (метаданных). Так как Shorts обычно смотрят в общей ленте, то авторы не заморачиваются с добавлением информации о ролике.

🫰 Flamingo решает эту проблему, создавая автоматически тексты для миллионов коротких клипов, размещенных на видеохостинге.

🫣 При этом авторы видео эти описания не увидят — метаданные будут использовать «за кулисами» для удобного поиска. Сейчас Flamingo в основном работает с новыми клипами, но постепенно обрабатывает и те, которые уже давно загружены на YouTube.

🔎 Google уже показывал алгоритм, который позволяет искать через поисковую строку информацию внутри видео. А стартап TwelveLabs получил от инвесторов $12 млн на аналогичную разработку.

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡4

1.44K views14:30

D. Lab

Маску разрешили протестировать нейрочип на людях, ИИ обманул профессиональных рекламщиков, у приложения TikTok появится чат-бот — и другие важные новости за неделю

✅ Meta* показала речевую модель с открытым кодом, которая может генерировать речь на более чем 1,1 тыс. языков и распознавать более 4 тыс. языков. Модель, в том числе тренировали на Новом Завете в различных переводах;

✅ Intel тоже не спит и анонсировал генеративный ИИ с триллионом параметров. Aurora GenAI будут использовать в научных целях, в частности, для экспериментов по созданию новых материалов. Обеспечивать работу искусственного интеллекта будет суперкомпьютер Aurora c вычислительной мощностью 2 экзафлопса;

✅ ИИ справился с «рекламным тестом Тьюринга». Эксперимент проводили впервые, в рамках маркетинговой конференции BrXnd. 17 маркетинговых экспертов должны были определить, кто автор рекламы — человек или нейросеть. Эксперты угадали правильный вариант только в 57% случаев. Варианты, сгенерированные ИИ, получили от экспертов 2,1 балла из 5,8 возможных, что является результатом выше среднего;

✅ Google анонсировал Product Studio — инструмент на основе ИИ, который позволит продавцам быстро отредактировать фото своего товара, чтобы представить его в наилучшем свете. Product Studio может удалить фон, улучшить качество фотографии и с нуля сгенерировать сцену, куда потом можно добавить товар. Сначала Product Studio будет доступен только продавцам в США;

✅ TikTok тестирует внутри приложения новый чат-бот Tako. Через него пользователь сможет узнать детали о просмотренном видео или попросить сделать подборку видео на определенную тему. Когда чат-бот сделают доступным для всех пользователей, не уточняется;

✅ Стартап Илона Маска Neuralink получил в США разрешение на тестирование своего нейрочипа на человеке. Еще в марте Управление по санитарному надзору США отклонило заявку Neuralink и указало на множественные проблемы. Видимо, за 3 месяца все их удалось исправить. Когда начнутся испытания — неизвестно;

✅ Стартап Neeva, который работал над умным поисковиком по подписке, решил свернуть проект. Разработчики признались, что не смогли заинтересовать проектом пользователей. Теперь компания собирается заняться большими языковыми моделями.

*Организация, запрещенная на территории РФ

👍4

536 views09:01

About

Blog

Apps

Platform