Дизайн Образования

Армия клонов или полномасштабное наступление цифровых двойников в обучении

На фоне громких побед ChatGPT тема цифровых двойников в обучении, казалось бы, отошла на второй план? Ничуть – не так давно был анонсирован целый ворох решений в этом поле.

Пионером тут конечно же выступает Nvidia. Прошлый год RnD компании потратил на изучение восприятия 3D аватаров пользователями.
Было установлено, что «роботизация» реалистичного лица воспринимается несколько хуже чем анимированный персонаж на основе того же лица.

Несмотря на это Synthesia (видео ) напротив, делает упор на реалистичность. Их решение снабдило аватаров от Nvidia живой мимикой. Теперь они могут подмигивать, поднимать брови, хмуриться, двигать головой для отрицания или согласия, а также коротко многозначительно кивать.

Кстати многие подозревают что на CES 2023 спикерами с презентации Nvidia были именно эти аватары топ менеджеров компании а не живые люди. Ссылка .
Посмотрите — чёткие паузы, ровный голос и повторяющиеся жесты.

В 2023 году NVIDIA предоставила ранний доступ к инструментарию по работе с аватарами в том числе с уклоном в мультяшность. Avatars Cloud Engine (сокращённо — ACE) (видео).

ACE это набор инструментов:

• Video-to-animation — создание анимации на основе ИИ-анализа видео;
• Audio2Face (https://youtu.be/h3xT_F_tEuU) — анимация лица с помощью речи из аудиофайла;
• Audio2Gesture (https://youtu.be/o6hhCRlTa9o) — перевод голосовых команд в ростовую анимацию;
• Video-to-2D-portrait-face-animation — анимация рисунков людей или портретов с помощью видео;
• Text-to-speech (https://developer.nvidia.com/riva) — перевод текста в синтезированную ИИ речь.

В качестве первых партнёров к Nvidia уже присоединились Epic Games c MetaHuman Creator и Ready Player Me.

Майкрософт выпустил диффузионную модель, которая способна построить 3D аватар по одной фотографии человека. Пример на видео – слева 1 фото и текстовое описание.

На выходе модель дает рендер 3D головы человека. С помощью изменения текстового описания можно редактировать то, как как аватар будет выглядеть.

Статья 1 и 2. Сайт проекта.

Не сказать что сама тема 3D аватаров так уж нова - на рынке существует уже ряд решений и от Realsoft (ссылка на видео) и от iClone (ссылка)

Но тем не менее именно за последний год тема 3D аватаров реальных людей получила активное развитие и в этом году с высокой долей вероятности мы увидим полноценные решения в области цифровых двойников и в образовании.

И наша лаборатория (ссылка на проект) и целый ряд российских стартапов уже начал активную работу в этом поле. Будем следить за их успехами.

#ARVR #newtech

Дзен.Видео

Дизайн Образования - авторский блог Андрея Комиссарова | Цифровые двойники от Synthesia

Synthesia делает упор на реалистичность снабдила аватаров от Nvidia живой мимикой. Теперь они могут подмигивать, поднимать брови, хмуриться, двигать…

3.6K viewsАндрей Комиссаров, edited 06:58

Дизайн Образования

Для тех у кого нет доступа к ChatGPT...

Звездная команда PhD (гляньте интереса ради на слайд команды) из Quora, Meta и Gmail собрала весьма полезный ии-поисковик, отвечающий на вопросы в стиле Quora или Stackoverflow.

Perplexity AI - это новый инструмент для общения с искусственным интеллектом, который действует как чрезвычайно мощная поисковая система.

Когда пользователь вводит вопрос, модель просматривает Интернет, чтобы дать ответ. И что хорошего в этом инструменте, так это его способность отображать источник информации, которую он предоставляет.

Веб-сайт имеет настройки, аналогичные Google. В нем есть центральная панель основного поиска, где вы в основном задаете ИИ любой вопрос. Однако Perplexity AI имеет преимущество. Похоже, он способен предоставлять информацию в режиме реального времени.

Когда его спросили, в какой день был выпущен Samsung Galaxy S23, ИИ удалось дать правильный ответ. Это довольно выдающийся результат, учитывая, что выпуск смартфона состоялся только на этой неделе.

Отдельно есть поиск по Twitter - птичий SQL.

Крайне полезная штука для тех из вас, кто так и не смог получить доступа к ChatGPT, потому как этот инструмент
а) Бесплатен и б) не дискриминирует Российские ip адреса

К слову ChatGPT имеет весьма ограниченные знания о событиях, произошедших после 2021 года, и не имеет возможности ссылаться на свои источники в той степени, в какой это может сделать Perplexity AI.

Больше по теме на канале Дизайн Образования

#ai #newtech

7.1K viewsАндрей Комиссаров, 22:50