эйай ньюз
66.1K subscribers
1.49K photos
792 videos
7 files
1.81K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
...Продолжение про Avatars Grow Legs (CVPR 2023)

Наша модель AGRoL — это диффузионную модель, которая синтезирует motion последовательности полного скелета человека (координаты + поворот 26 точек) по трем входным точкам. Более того, мы задизайнили AGRoL с помощью эффективной архитектуры, которая состоит только из линейных слоёв, которые применяются попеременно по временной оси и по пространственной, что существенно увеличивает скорость семплинга.

Во время инференса, мы прогоняем 5 шагов DDIM. В итоге AGRoL работает со скоростью 30 FPS на V100, что довольно быстро для диффузионных моделей.

🔊Смотрите видео-презентацию со звуком. Полная версия тут.

@ai_newz
Если бы в футбол играли персонажи из Dota 2, то phygital-сборная России, созданная нейросетями, выглядела бы так.

Если вы тоже не знаете, что такое фиджитал, вам сюда: https://t.iss.one/myfuturesport

Промо
This media is not supported in your browser
VIEW IN TELEGRAM
🐶Робопёсик Spot научился говорить

Ребята из Boston Dynamics, которые создают всем известных роботов, прикрутили ChatGPT к своему робопёсику. Это дало роботу возможность докладывать о результатах выполненных миссий и отвечать на любые вопросы о ходе выполнения задания на человеческом языке.

Например, миссией пса могла быть пройти по локации и проверить некоторые датчики.

ChatGPT на вход получает огромный json файл с конфигурацией миссии и данными, собранными во время выполнения. И бот отвечает на любые вопросы пользователя используя инфу из json. Т.к. данных много, вместить весь файл в контекст ChatGPT не получится (пока... я тут писал про попытки вместить до 1млн токенов). Поэтому файл разбивается на маленькие куски, для каждого из которых считается эмбединг. Во время инференса: по заданному вопросу быстро ищутся наиболее релевантные куски, используя расстояния между эмбедингами и отправляются
в контекст GPT, чтобы выдать наиболее точный ответ.

Для озвучки пёсика взяли text2speech API от Гугла.

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
🦮 Вербальное управление робопёсиком Spot с помощью Whisper

В предыдущем посте я допустил неточность. ChatGPT к робопёсику Spot прикрутили не Boston Dynamics, а их партнёры – фирма Levatas, которая программирует Спотов выполнять различные миссии в индустрии. Например, побегать по фабрике и проверить, что все в порядке, снять показания с датчиков температуры, давления и т.д., сделать теплоснимки оборудования, и прочие рутинные задачи, которые нужно регулярно выполнять в индустрии.

"There is nothing better than looking at the effect of you code in real-time". Как же я согласен с этим!

На видео пример того, как парни используют модель Whisper (я про нее писал в этом посте) для передачи базовых команд робопсу.

@ai_newz
OpenLLaMA: An Open Reproduction of LLaMA

Полундра! Тут челы из университета Berkeley зарелизили полностью опен-соурсную репродукцию LLaMA 7B с лицензией Apache 2.0. Пока натренировали модель на 200 миллиардах токенов из датасета RedPajama, о котором я недавно рассказывал.

Чекпоинт, который доступен уже сейчас, выдает результаты на различных бенчмарках как минимум не хуже оригинальной LLaMA от Meta. И ребята продолжаю тренить, чтобы модель увидела хотя бы триллион различных токенов, как это было у оригинальной LLaMA. Ожидают, что когда полностью закончат тренировку на триллионе токенов из RedPajama, OpenLLaMA превзойдет оригинал.

Скачать веса на PyTorch и JAX

@ai_newz
AI-Tutor на базе ChatGPT-4

Репетиторы вышли из чата. Если вы до этого не пользовались гпт для изучения чего-то нового, то кажется, вы что-то упустили. Будь-то иностранные языки, литература или ML, ChatGPT выстроит вам учебный план, объяснит материал и будет терпеливо отвечать на все вопросы. А затем протестирует вас для закрепления знаний.

Ни для кого уже не секрет, что для максимизации полезности языковых моделей нужны правильные промпты. Так вот для включения режима AI-учителя, положен правильный промпт с этого репозитория, завирусившегося в твиттере.

Просто копируете содержимое json файла в новый чат GPT-4 и погнали. Далее устанавливаете стиль учителя и глубину материала (см скрины), просите составить план изучения командой /plan и приступаете к интерактивному изучению.

Я, например, поизучал TRON блокчейн и мне прям зашло. Особенно круто работает по темам, где вы еще не эксперт, на которые хотите получить плотную иформацию и позадавать глупые вопросы без стеснения.

Подробная инструкция.

@ai_newz
эйай ньюз
Photo
В дополнение к AI-учителю из предыдущего поста. Такой промпт в формате json позволяет легко подстраивать учителя под себя.

Например, чтобы позволить ему генерировать примеры на Python, достаточно добавить в конфиге python_enabled: true.

А чтобы изменить язык, как предложил подписчик, можно добавить language: "Russian".

Что касается истинности информации, которую AI-учитель выдает, то когда будет открыт доступ к плагинам, ChatGPT сможет гуглить информацию и подкреплять свои ответы ссылками на статьи в интернете. Вот тогда заживём :) А пока просто читаем выдачу ChatGPT со щепоткой скептицизма.

Важно: промпт уверенно работает только в ChatGPT-4. ChatGPT-3.5 может не потянуть и выдавать не такие хорошие результаты.