Технозаметки Малышева

Meta-Transformer: A Unified Framework for Multimodal Learning

The landscape of multimodal learning is about to witness a remarkable transformation with the introduction of Meta-Transformer, a state-of-the-art framework that's poised to overcome long-standing challenges in the field. The beauty of Meta-Transformer lies in its unique ability to process and understand information from a diverse range of modalities - from natural language, 2D images, 3D point clouds, to audio, video, time series, and tabular data. This ability stems from its innovative design that leverages a frozen encoder to map raw input data from these diverse modalities into a shared token space, eliminating the need for paired multimodal training data.

More than just a theoretical achievement, the Meta-Transformer has proven its practical application across various benchmarks, handling an impressive range of tasks from fundamental perception such as text, image, and audio processing, to more complex applications like X-Ray, infrared, and hyperspectral data interpretation, as well as data mining tasks involving graph, tabular, and time-series data.

Code link: https://github.com/invictus717/MetaTransformer
Paper link: https://arxiv.org/abs/2307.10802

A detailed unofficial overview of the paper:
https://andlukyane.com/blog/paper-review-meta-transformer

#deeplearning #nlp #transformer #cv

17 views07:06

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Прорыв в передвижении гуманоидных роботов с помощью ИИ

Разработан уникальный контроллер для управления движением гуманоидов.
Используется Transformer модель, предсказывающая действия по истории обучения.
Накопленные данные помогают модели адаптироваться к реальным условиям без доработки весов.
Обучение проходило в симулированных средах, использовались усиление и параллелизм на GPU.
Высокая адаптивность: политики обучения переносятся в реальность без доп. данных.
Всесторонняя мобильность: контроллер проходит испытания на различных местностях.
Возможность выполнения команд: двигаться в разные стороны, поворачивать.
Достижение человекоподобной координации рук и ног.
Умение робота восстанавливаться после защемления ноги, адаптируясь к местности.
Контроллер стойко справляется с внешними воздействиями, как удары или толчки.

Через пару лет - будут свободно гулять по улицам. Главное что бы не с автоматами.

#Роботы #Transformer

🔥1

82 views07:04

About

Blog

Apps

Platform