Бегающими, прыгающими и танцующими роботами уже мало кого удивишь. Но вот чтоб роботу были доступны любые аллюры - от галопа и рыси до тёльта и пасо фино, - это что-то новое.
Но это только присказка циклических движений.
А сказка впереди – умение робота выполнять ациклические движения, требующие уникальной координации всех конечностей и тела.
Вот пример в стиле Джеки Чана - удар в прыжке пяткой в ухо противника (первые 5 сек видео).
А дальше еще на 4 мин WEEKEND VIDEO робот-лошарик бегает разными аллюрами.
https://www.youtube.com/watch?v=dS_HUq1-pQY
А вот как этого добились https://arxiv.org/pdf/2201.07601.pdf
#Роботы
Но это только присказка циклических движений.
А сказка впереди – умение робота выполнять ациклические движения, требующие уникальной координации всех конечностей и тела.
Вот пример в стиле Джеки Чана - удар в прыжке пяткой в ухо противника (первые 5 сек видео).
А дальше еще на 4 мин WEEKEND VIDEO робот-лошарик бегает разными аллюрами.
https://www.youtube.com/watch?v=dS_HUq1-pQY
А вот как этого добились https://arxiv.org/pdf/2201.07601.pdf
#Роботы
YouTube
BiConMP: A Nonlinear Model Predictive Control Framework for Whole Body Motion Planning
Online planning of whole-body motions for legged robots is challenging due to the inherent nonlinearity in the robot dynamics. In this work https://arxiv.org/pdf/2201.07601.pdf , we propose a nonlinear MPC framework, the BiConMP which can generate whole…
Создан первый частично самоосознающий себя робот.
Прорыв в понимании важной части модели мира – модели самого себя.
Пока Илон Маск пиарится на дутой разработке «дружелюбного» человекоподобного робота с ИИ (это чистая разводка для хайпа), в мире ИИ происходит воистину тектонический сдвиг. Создан первый в мире робот не с абстрактным ИИ, а с самоосознающим ИИ.
Это значит следующее:
• робот, интеллект которого изначально не имеет никакой модели самого себя (точнее, действий своего тела в окружающем пространстве), может самостоятельно построить эту модель;
• он делает это без помощи людей, а лишь наблюдая за своими движениями, в ходе обретения им практического опыта;
• используя полученную модель самого себя, робот может предельно точно действовать в окружающем мире;
• при повреждении своего тела (типа ногу сломал, руку оторвало и т.д.) робот, подобно животным и людям, сам адаптируется к новой ситуации, реконструировав свои программы движений;
• а если, например, завтра после включения робота, он узнает, что у него теперь не одна рука, а семь, он также сам адаптируется к новой ситуации, реконструировав свои программы движений в стиле осьминога.
Принципиальный прорыв совершён за счет сочетания 2х прорывных моментов:
✔️люди не закладывают в робота знание того:
• как устроено его тело,
• какова кинематика движений его подвижных частей,
• каковы способы их сочленения - углы, амплитуды и траектории движений частей
✔️ вместо этого, глубокую нейронную сеть научили определять положение частей своего тела в окружающем пространстве:
• поместили роборуку (рука пока одна, но это дело наживное) в круг из пяти видеокамер, транслирующих в нейронную сеть прямую трансляцию о движениях роборуки,
• в ходе движений роборука наблюдает за собой через камеры, а её внутренняя сеть определяет положение суставов по отношению к объему, занимаемому роборукой в окружающей среде.
Через три часа нейросеть робруки построила полную визуальную модель самой себя и своих движений.
Эта собственная модель позволяет роботу планировать действия и избегать препятствий, поскольку он знает, будет ли место в пространстве занято, если его суставы сместятся под определенными углами, а части сдвинутся по такой траектории с определенной амплитудой.
Тестовая задача была коснуться мяча любой частью тела. Планирование движения, созданное на основе собственной модели, достигло 97% успеха при выполнении поставленных задач и является таким же точным, как и реальное выполнение.
Значимость этой работы выходит далеко за пределы робототехники по двум причинам.
1. Это первый робот, управляющий своим движением подобно мозгу.
Модель мозга строится с использованием картографических систем отсчета. Системы отсчета сообщают нам, где вещи (и где мы сами) расположены относительно друг друга, и позволяют нам двигаться, планировать и достигать целей.
2. Модель управления движением может оказаться универсальной моделью познавательных способностей, позволяющей понять, как в материальном мозге рождается нематериальные сознание и мышление.
Согласно «гипотезе интеллекта и воплощения» (intelligence and embodiment hypothesis — см. мой пост), познавательная способность разума, реализуемая механизмом мышления, возникла в результате переадаптации системы управления движением в ходе миллионов лет экспериментов «самоделкина» — эволюции. Т.е. с эволюционной точки зрения обширный нейронный механизм, разработанный для контроля движения животных, был расширен, чтобы контролировать новые структуры мозга вместо мышц.
Идя этим путем, возможно, удастся понять, описать и повторить не только уникальную моторику людей (в роботах), но и уникальные познавательные способности разума людей (в искусственном интеллекте).
#ВоплощенныйИнтеллект #Разум #Движение #Роботы
PS Самоосознание своего тела – лишь малая (но важная) часть самоосознания.
PSS Новость поста столь горячая, что я пустил ее вместо 2й части лонгрида «У землян всего два варианта будущего» – 2я часть на подходе ))
Прорыв в понимании важной части модели мира – модели самого себя.
Пока Илон Маск пиарится на дутой разработке «дружелюбного» человекоподобного робота с ИИ (это чистая разводка для хайпа), в мире ИИ происходит воистину тектонический сдвиг. Создан первый в мире робот не с абстрактным ИИ, а с самоосознающим ИИ.
Это значит следующее:
• робот, интеллект которого изначально не имеет никакой модели самого себя (точнее, действий своего тела в окружающем пространстве), может самостоятельно построить эту модель;
• он делает это без помощи людей, а лишь наблюдая за своими движениями, в ходе обретения им практического опыта;
• используя полученную модель самого себя, робот может предельно точно действовать в окружающем мире;
• при повреждении своего тела (типа ногу сломал, руку оторвало и т.д.) робот, подобно животным и людям, сам адаптируется к новой ситуации, реконструировав свои программы движений;
• а если, например, завтра после включения робота, он узнает, что у него теперь не одна рука, а семь, он также сам адаптируется к новой ситуации, реконструировав свои программы движений в стиле осьминога.
Принципиальный прорыв совершён за счет сочетания 2х прорывных моментов:
✔️люди не закладывают в робота знание того:
• как устроено его тело,
• какова кинематика движений его подвижных частей,
• каковы способы их сочленения - углы, амплитуды и траектории движений частей
✔️ вместо этого, глубокую нейронную сеть научили определять положение частей своего тела в окружающем пространстве:
• поместили роборуку (рука пока одна, но это дело наживное) в круг из пяти видеокамер, транслирующих в нейронную сеть прямую трансляцию о движениях роборуки,
• в ходе движений роборука наблюдает за собой через камеры, а её внутренняя сеть определяет положение суставов по отношению к объему, занимаемому роборукой в окружающей среде.
Через три часа нейросеть робруки построила полную визуальную модель самой себя и своих движений.
Эта собственная модель позволяет роботу планировать действия и избегать препятствий, поскольку он знает, будет ли место в пространстве занято, если его суставы сместятся под определенными углами, а части сдвинутся по такой траектории с определенной амплитудой.
Тестовая задача была коснуться мяча любой частью тела. Планирование движения, созданное на основе собственной модели, достигло 97% успеха при выполнении поставленных задач и является таким же точным, как и реальное выполнение.
Значимость этой работы выходит далеко за пределы робототехники по двум причинам.
1. Это первый робот, управляющий своим движением подобно мозгу.
Модель мозга строится с использованием картографических систем отсчета. Системы отсчета сообщают нам, где вещи (и где мы сами) расположены относительно друг друга, и позволяют нам двигаться, планировать и достигать целей.
2. Модель управления движением может оказаться универсальной моделью познавательных способностей, позволяющей понять, как в материальном мозге рождается нематериальные сознание и мышление.
Согласно «гипотезе интеллекта и воплощения» (intelligence and embodiment hypothesis — см. мой пост), познавательная способность разума, реализуемая механизмом мышления, возникла в результате переадаптации системы управления движением в ходе миллионов лет экспериментов «самоделкина» — эволюции. Т.е. с эволюционной точки зрения обширный нейронный механизм, разработанный для контроля движения животных, был расширен, чтобы контролировать новые структуры мозга вместо мышц.
Идя этим путем, возможно, удастся понять, описать и повторить не только уникальную моторику людей (в роботах), но и уникальные познавательные способности разума людей (в искусственном интеллекте).
#ВоплощенныйИнтеллект #Разум #Движение #Роботы
PS Самоосознание своего тела – лишь малая (но важная) часть самоосознания.
PSS Новость поста столь горячая, что я пустил ее вместо 2й части лонгрида «У землян всего два варианта будущего» – 2я часть на подходе ))
Робототехника дала альтернативный сценарий развития Homo.
Можно было очеловечиться, не потеряв способность быстро бегать.
Такая возможность была продемонстрирована на прошлой неделе на Международной конференции по интеллектуальным роботам IROS 2022 в Японии.
Казалось бы, где роботы и где эволюция Homo. Но дело вот в чём.
Сценарии эволюции видов, скорее всего, неповторимы. И если люди таки угробят свой вид, то новый носитель высшего интеллекта вряд ли эволюционирует по пути гоминид. Каким может быть альтернативный путь, до последнего времени, был исключительно вопросом фантастов. Но с развитием робототехники, кое-что стало проясняться.
И вот появился первый замечательный пример – как животное может эволюционировать из четвероногого в двуногое, не потеряв при этом в скорости бега.
Тренированные люди могут бежать со скоростью 15-20 км/ч. Это вдвое медленнее коровы, вчетверо – тигра и всемеро – гепарда.
Такова плата за двуногость, запустившую процесс «очеловечивания» наших предков. Из совокупности 3-х признаков, характерных только для людей (двуногость, хватательная кисть и объемный, высокоразвитый мозг), двуногость эволюционно развилась первой, что сыграло ключевую роль для всей последующей истории гоминид.
Двуногость освободила руки, без чего не было бы сложных орудий и вообще нашей культуры. Но за это пришлось дорого заплатить трудностями при вынашивании плода и при родах, нарушением в кровообращении, пищеварении и самым очевидным преимуществом – скоростью бега (столь важной для выживания).
А можно ли обрести двуногость, сохранив преимущество быстрого бега на 4-х?
На IROS 2022 исследователи из WPI Robotics Engineering и Шанхайского технологического университета представили обобщенный метод превращения 4-хногого робота в двуногого с помощью умного алгоритма и небольшой модификации.
Если бы эволюция развила у наших предков отросток на голени задних конечностей, это обеспечило бы устойчивость при ходьбе на 2-х, сохранив способность к быстрому бегу на 4-х. Конечно, потребовалась бы еще «перепрошивка» двигательных программ мозга иным алгоритмом обучения. Но подобное перепрограммирование эволюцией освоено в совершенстве.
Результат такого альтернативного сценария эволюции двуногости у робота разработки WPI Robotics Engineering и Шанхайского технологического университета можно увидеть на этом видео.
Это видео не столь эмоционально потрясает, как фрагмент знаменитого фильма «2001: Космическая одиссея», где «Черный монолит» заработал, запустив процесс антропогенеза под музыку Рихарда Штрауса «Так говорил Заратустра» (подробней о том, что это было, см. в моём посте).
Однако, по сути, это видео вставшего и пошедшего на двух ногах робота не менее потрясающе.
Не тем, что 4-х ногий робот пошел на 2-х. Такое уже делали на специально разработанных роботах. Здесь же мы видим универсальное простое решение, подходящее для трансформации любых (!) четвероногих в мультимодальных (ходящих на 2-х и бегающих на 4-х). И тем самым, мы наглядно видим, как эволюция предков людей могла запросто пойти по иному сценарию.
Ну а то, насколько искусно эволюция умеет делать подобные вещи, мы знаем на реальных примерах. Чего стоит «двойная эволюция» китообразных: сначала сотни миллионов лет приспособления к сухопутной среде, а потом еще полсотни миллионов – к водной (с полной перестройкой тела и тотальной “перепрошивкой” мозга сухопутных китопарнокопытных). И уж если с превращением лап в плавники у эволюции проблем не было, то уж с костным отростком на голени она справилась бы запросто. А смена алгоритма обучения на бимодальный, как показал эксперимент с роботом, оказалась весьма несложной и продуктивной.
И бегали бы люди по улицам городов с ограниченной правилами скоростью. А распространенность легковых авто была бы, как сейчас у частных самолетов – тысяч 20 на весь мир.
#Эволюция #Роботы
Можно было очеловечиться, не потеряв способность быстро бегать.
Такая возможность была продемонстрирована на прошлой неделе на Международной конференции по интеллектуальным роботам IROS 2022 в Японии.
Казалось бы, где роботы и где эволюция Homo. Но дело вот в чём.
Сценарии эволюции видов, скорее всего, неповторимы. И если люди таки угробят свой вид, то новый носитель высшего интеллекта вряд ли эволюционирует по пути гоминид. Каким может быть альтернативный путь, до последнего времени, был исключительно вопросом фантастов. Но с развитием робототехники, кое-что стало проясняться.
И вот появился первый замечательный пример – как животное может эволюционировать из четвероногого в двуногое, не потеряв при этом в скорости бега.
Тренированные люди могут бежать со скоростью 15-20 км/ч. Это вдвое медленнее коровы, вчетверо – тигра и всемеро – гепарда.
Такова плата за двуногость, запустившую процесс «очеловечивания» наших предков. Из совокупности 3-х признаков, характерных только для людей (двуногость, хватательная кисть и объемный, высокоразвитый мозг), двуногость эволюционно развилась первой, что сыграло ключевую роль для всей последующей истории гоминид.
Двуногость освободила руки, без чего не было бы сложных орудий и вообще нашей культуры. Но за это пришлось дорого заплатить трудностями при вынашивании плода и при родах, нарушением в кровообращении, пищеварении и самым очевидным преимуществом – скоростью бега (столь важной для выживания).
А можно ли обрести двуногость, сохранив преимущество быстрого бега на 4-х?
На IROS 2022 исследователи из WPI Robotics Engineering и Шанхайского технологического университета представили обобщенный метод превращения 4-хногого робота в двуногого с помощью умного алгоритма и небольшой модификации.
Если бы эволюция развила у наших предков отросток на голени задних конечностей, это обеспечило бы устойчивость при ходьбе на 2-х, сохранив способность к быстрому бегу на 4-х. Конечно, потребовалась бы еще «перепрошивка» двигательных программ мозга иным алгоритмом обучения. Но подобное перепрограммирование эволюцией освоено в совершенстве.
Результат такого альтернативного сценария эволюции двуногости у робота разработки WPI Robotics Engineering и Шанхайского технологического университета можно увидеть на этом видео.
Это видео не столь эмоционально потрясает, как фрагмент знаменитого фильма «2001: Космическая одиссея», где «Черный монолит» заработал, запустив процесс антропогенеза под музыку Рихарда Штрауса «Так говорил Заратустра» (подробней о том, что это было, см. в моём посте).
Однако, по сути, это видео вставшего и пошедшего на двух ногах робота не менее потрясающе.
Не тем, что 4-х ногий робот пошел на 2-х. Такое уже делали на специально разработанных роботах. Здесь же мы видим универсальное простое решение, подходящее для трансформации любых (!) четвероногих в мультимодальных (ходящих на 2-х и бегающих на 4-х). И тем самым, мы наглядно видим, как эволюция предков людей могла запросто пойти по иному сценарию.
Ну а то, насколько искусно эволюция умеет делать подобные вещи, мы знаем на реальных примерах. Чего стоит «двойная эволюция» китообразных: сначала сотни миллионов лет приспособления к сухопутной среде, а потом еще полсотни миллионов – к водной (с полной перестройкой тела и тотальной “перепрошивкой” мозга сухопутных китопарнокопытных). И уж если с превращением лап в плавники у эволюции проблем не было, то уж с костным отростком на голени она справилась бы запросто. А смена алгоритма обучения на бимодальный, как показал эксперимент с роботом, оказалась весьма несложной и продуктивной.
И бегали бы люди по улицам городов с ограниченной правилами скоростью. А распространенность легковых авто была бы, как сейчас у частных самолетов – тысяч 20 на весь мир.
#Эволюция #Роботы
YouTube
Multi-Modal Legged Locomotion Framework with Automated Residual Reinforcement Learning
This is the supplementary video of paper Multi-Modal Legged Locomotion Framework with Automated Residual Reinforcement Learning (Hybrid Residual Reinforcement Learning on a Multi-Modal Legged Robot), under review as a conference paper at IROS 2022 (https…
Google DeepMind сумела запустить когнитивную эволюцию роботов
Это может открыть путь к гибридному обществу людей и андроидов
1я ноябрьская ИИ-революция (Революция ChatGPT) началась год назад - в ноябре 2022. Она ознаменовала появление на планете нового носителя высшего интеллекта — цифрового ИИ, способного достичь (и, возможно, превзойти) людей в любых видах интеллектуальной деятельности.
Но не смотря на сравнимый с людьми уровень, этот новый носитель высшего интеллекта оказался абсолютно нечеловекоподобным.
Он принадлежит к классу генеративного ИИ больших языковых моделей, не умеющих (и в принципе не способных) не то что мечтать об электроовцах, но и просто мыслить и познавать мир, как это делают люди. И потому, даже превзойдя по уровню людей, он так и останется для человечества «чужим» — иным типом интеллекта, столь же непостижимым для понимания, как интеллект квинтян из романа Станислава Лема «Фиаско».
Причина нечеловекоподобия генеративных ИИ больших языковых моделей заключается в их кардинально иной природе.
✔️ Наш интеллект – результат миллионов лет когнитивной эволюции биологических интеллектуальных агентов, позволившей людям из животных превратиться в сверхразумные существа, построивших на Земле цивилизацию планетарного уровня, начавшую освоение космоса.
✔️ ИИ больших языковых моделей – продукт машинного обучения компьютерных программ на колоссальных объемах цифровых данных.
Преодолеть это принципиальное отличие можно, если найти ключ к запуску когнитивной эволюции ИИ.
И этот ключ предложен в ноябре 2023 инициаторами 2й ноябрьской ИИ-революции (Революции когнитивной эволюции ИИ) в опубликованном журналом Nature исследовании Google DeepMind.
• Движком когнитивной эволюции ИИ авторы предлагают сделать (как и у людей) социальное обучение — когда один интеллектуальный агент (человек, животное или ИИ) приобретает навыки и знания у другого путем копирования (жизненно важного для процесса развития интеллектуальных агентов).
• Ища вдохновение в социальном обучении людей, исследователи стремились найти способ, позволяющий агентам ИИ учиться у других агентов ИИ и у людей с эффективностью, сравнимой с человеческим социальным обучением.
• Команде исследователей удалось использовать обучение с подкреплением для обучения агента ИИ, способного идентифицировать новых для себя экспертов (среди других агентов ИИ и людей), имитировать их поведение и запоминать полученные знания в течение всего нескольких минут.
"Наши агенты успешно имитируют человека в реальном времени в новых контекстах, не используя никаких предварительно собранных людьми данных. Мы определили удивительно простой набор ингредиентов, достаточный для культурной передачи, и разработали эволюционную методологию для ее систематической оценки. Это открывает путь к тому, чтобы культурная эволюция играла алгоритмическую роль в развитии искусственного общего интеллекта", - говорится в исследовании.
Запуск когнитивной эволюции ИИ позволит не только создать «человекоподобный ИИ» у роботов – андроидов, но и разрешить при их создании Парадокс Моравека (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов) и Сверхзадачу Минского (произвести обратную разработку навыков, получаемых в процессе передачи неявных знаний - невербализованных и, часто, бессознательных)
Т.о. не будет большим преувеличением сказать, что 2я ноябрьская революция ИИ открывает путь к гибридному обществу людей и андроидов, – многократно описанному в фантастических романах, но до сих пор остававшемуся практически нереализуемым на ближнем временном горизонте.
Подробный разбор вопросов когнитивной эволюции путем копирования, а также революционного подхода к ее запуску, предложенного Google DeepMind, см. в моем новом лонгриде (еще 10 мин чтения):
- на Medium https://bit.ly/486AfEN
- на Дзене https://clck.ru/36wWQc
#ИИ #Интеллект #Разум #Эволюция #Культура #АлгокогнитивнаяКультура #Роботы
Это может открыть путь к гибридному обществу людей и андроидов
1я ноябрьская ИИ-революция (Революция ChatGPT) началась год назад - в ноябре 2022. Она ознаменовала появление на планете нового носителя высшего интеллекта — цифрового ИИ, способного достичь (и, возможно, превзойти) людей в любых видах интеллектуальной деятельности.
Но не смотря на сравнимый с людьми уровень, этот новый носитель высшего интеллекта оказался абсолютно нечеловекоподобным.
Он принадлежит к классу генеративного ИИ больших языковых моделей, не умеющих (и в принципе не способных) не то что мечтать об электроовцах, но и просто мыслить и познавать мир, как это делают люди. И потому, даже превзойдя по уровню людей, он так и останется для человечества «чужим» — иным типом интеллекта, столь же непостижимым для понимания, как интеллект квинтян из романа Станислава Лема «Фиаско».
Причина нечеловекоподобия генеративных ИИ больших языковых моделей заключается в их кардинально иной природе.
✔️ Наш интеллект – результат миллионов лет когнитивной эволюции биологических интеллектуальных агентов, позволившей людям из животных превратиться в сверхразумные существа, построивших на Земле цивилизацию планетарного уровня, начавшую освоение космоса.
✔️ ИИ больших языковых моделей – продукт машинного обучения компьютерных программ на колоссальных объемах цифровых данных.
Преодолеть это принципиальное отличие можно, если найти ключ к запуску когнитивной эволюции ИИ.
И этот ключ предложен в ноябре 2023 инициаторами 2й ноябрьской ИИ-революции (Революции когнитивной эволюции ИИ) в опубликованном журналом Nature исследовании Google DeepMind.
• Движком когнитивной эволюции ИИ авторы предлагают сделать (как и у людей) социальное обучение — когда один интеллектуальный агент (человек, животное или ИИ) приобретает навыки и знания у другого путем копирования (жизненно важного для процесса развития интеллектуальных агентов).
• Ища вдохновение в социальном обучении людей, исследователи стремились найти способ, позволяющий агентам ИИ учиться у других агентов ИИ и у людей с эффективностью, сравнимой с человеческим социальным обучением.
• Команде исследователей удалось использовать обучение с подкреплением для обучения агента ИИ, способного идентифицировать новых для себя экспертов (среди других агентов ИИ и людей), имитировать их поведение и запоминать полученные знания в течение всего нескольких минут.
"Наши агенты успешно имитируют человека в реальном времени в новых контекстах, не используя никаких предварительно собранных людьми данных. Мы определили удивительно простой набор ингредиентов, достаточный для культурной передачи, и разработали эволюционную методологию для ее систематической оценки. Это открывает путь к тому, чтобы культурная эволюция играла алгоритмическую роль в развитии искусственного общего интеллекта", - говорится в исследовании.
Запуск когнитивной эволюции ИИ позволит не только создать «человекоподобный ИИ» у роботов – андроидов, но и разрешить при их создании Парадокс Моравека (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов) и Сверхзадачу Минского (произвести обратную разработку навыков, получаемых в процессе передачи неявных знаний - невербализованных и, часто, бессознательных)
Т.о. не будет большим преувеличением сказать, что 2я ноябрьская революция ИИ открывает путь к гибридному обществу людей и андроидов, – многократно описанному в фантастических романах, но до сих пор остававшемуся практически нереализуемым на ближнем временном горизонте.
Подробный разбор вопросов когнитивной эволюции путем копирования, а также революционного подхода к ее запуску, предложенного Google DeepMind, см. в моем новом лонгриде (еще 10 мин чтения):
- на Medium https://bit.ly/486AfEN
- на Дзене https://clck.ru/36wWQc
#ИИ #Интеллект #Разум #Эволюция #Культура #АлгокогнитивнаяКультура #Роботы
Medium
Google DeepMind сумела запустить когнитивную эволюцию роботов
Это может открыть путь к гибридному обществу людей и андроидов
Наконец-то снято проклятье Моравека-Минского.
Первый в мире робот – домработница: уборка, стирка, уход, готовка, мытье посуды и т.д.
Пока мы праздновали, в мире случился реальный прорыв в робототехнике, сопоставимый с «революцией ChatGPT» (см. видео на англ [1] и с переводом [2])
Робот Mobile Aloha - разработка Стэнфордского универа [3]:
• преодолел «парадокс Моравека» (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов), из-за которого обучение робота – домработницы стоило раньше огромных денег;
• решил «сверхзадачу Минского» (произвести обратную разработку навыков, которые являются бессознательными), - ведь именно бессознательно домработница выполняет почти все работы по дому 😊 (подробней см. [4]).
Прорыв оказался возможным благодаря имитационному обучения робота. Он учится, как дети, - на основе полусотни демонстраций обучающих действий людьми (Imitation learning from human-provided demonstrations).
- как это происходит см. на видео.
Дополнительными факторами прорыва стали:
• умение согласованно использовать две руки-манипуляторы (быть эффективной однорукой домработницей весьма затруднительно);
• контроль всего тела (а не только рук) при выполнении мобильных задач (попробуйте, например, без этого просто собрать разбросанные по дому вещи).
Стоимость прототипа такой домработницы всего $32 тыс. На Trossenrobotics уже предлагают за $20 тыс. Ну а при массовом производстве снизить цену на порядок – как нечего делать.
И тогда через пяток лет роботы – домработницы могут стать столь же распространенными, как сейчас пылесосы - т.е. есть у всех.
При таком раскладе Илону Маску, возможно, стоит забить на разработку своих андроидов в стиле Голливуда и переключиться на невзрачных, но простых и полезных механических домработниц.
#Роботы
1 https://www.youtube.com/watch?v=ysZCGhgZTsA
2 https://www.youtube.com/watch?v=WJ2WTYS33Lo
3 https://mobile-aloha.github.io/
4 https://t.iss.one/theworldisnoteasy/1854
Первый в мире робот – домработница: уборка, стирка, уход, готовка, мытье посуды и т.д.
Пока мы праздновали, в мире случился реальный прорыв в робототехнике, сопоставимый с «революцией ChatGPT» (см. видео на англ [1] и с переводом [2])
Робот Mobile Aloha - разработка Стэнфордского универа [3]:
• преодолел «парадокс Моравека» (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов), из-за которого обучение робота – домработницы стоило раньше огромных денег;
• решил «сверхзадачу Минского» (произвести обратную разработку навыков, которые являются бессознательными), - ведь именно бессознательно домработница выполняет почти все работы по дому 😊 (подробней см. [4]).
Прорыв оказался возможным благодаря имитационному обучения робота. Он учится, как дети, - на основе полусотни демонстраций обучающих действий людьми (Imitation learning from human-provided demonstrations).
- как это происходит см. на видео.
Дополнительными факторами прорыва стали:
• умение согласованно использовать две руки-манипуляторы (быть эффективной однорукой домработницей весьма затруднительно);
• контроль всего тела (а не только рук) при выполнении мобильных задач (попробуйте, например, без этого просто собрать разбросанные по дому вещи).
Стоимость прототипа такой домработницы всего $32 тыс. На Trossenrobotics уже предлагают за $20 тыс. Ну а при массовом производстве снизить цену на порядок – как нечего делать.
И тогда через пяток лет роботы – домработницы могут стать столь же распространенными, как сейчас пылесосы - т.е. есть у всех.
При таком раскладе Илону Маску, возможно, стоит забить на разработку своих андроидов в стиле Голливуда и переключиться на невзрачных, но простых и полезных механических домработниц.
#Роботы
1 https://www.youtube.com/watch?v=ysZCGhgZTsA
2 https://www.youtube.com/watch?v=WJ2WTYS33Lo
3 https://mobile-aloha.github.io/
4 https://t.iss.one/theworldisnoteasy/1854
YouTube
Google AI new robot Mobile Aloha Stunned the industry | AI News
Researchers unveil Mobile Aloha - a revolutionary robot showcasing tremendous advancements in mobility, manipulation, and autonomous learning. See how it uses teleoperation and behavioral cloning to rapidly acquire mobile manipulation skills like cooking…
Революция роботов намечена на март.
Такого техно-прорыва не было со времен Прометея.
Суть ожидаемого прорыва – разрешение парадокса Моравека, несокрушимой стеной преграждающего путь к человекоподобному Сильному-ИИ (AGI), а потом и к Супер-ИИ.
Логика здесь проста:
• Для достижения уровня AGI, интеллектуальный агент должен иметь тело (именно оно будет «жить», адаптируясь к внешней среде и взаимодействуя с ней и себе подобными)
• Однако, на пути к отелесниванию ИИ стоит парадокс Моравека, согласно которому. управление низкоуровневыми сенсомоторными операциями (операциями тела) требует огромных вычислительных ресурсов, - даже больших, чем управление высококогнитивными процессами (сложными мысленными операциями мозга).
• Т.е. без человекоподобного тела (робота - андроида) не будет AGI, а для «жизни» андроиду не хватает вычислительных ресурсов.
Что обещают в марте.
Бернт Борних - СЕО компании 1Х (на которую OpenAI сделал ставку в робототехнике андроидов), - объявил, что в марте, похоже, будет доказано, что ограничение парадокса Моравека было ложное, и оно возникало всего лишь из-за банальной нехватки данных [1].
Речь, скорее всего, идет о выпуске андроида NEO - «брата» Евы (андроид EVE). NEO будет превосходить «сестру» во многом и кроме того, будет передвигаться на ногах, а не на колесах.
Январская демонстрация Евы (демонстрация [2] и ее разбор [0]) была настолько поразительной, что редакция IEEE Spectrum даже провела свое расследование – не прятались ли под костюмами андроидов люди. Но все оказалось чисто – не подкопаешься [3].
Фишка андроидов компании 1Х в движке, разработанном OpenAI. Это нейронка, как и разум человека, работает, учась на данных, поступающих от зрения, и генерирующая действия (управление движением, руками, захватами, туловищем и головой) с частотой 10 Гц.
«Базовая модель» понимает широкий спектр физического поведения: от уборки дома до сбора предметов на складе и социального взаимодействия с людьми и другими роботами. Но самое главное в том, что новые навыки появляются у андроида всего за несколько минут сбора данных и обучения, - путем наблюдения за тем, как это делают люди.
Для скептиков, сомневающихся в грядущем опровержении парадокса Моравека (даже если за этим видны уши OpenAI), рекомендую объявление, сделанное позавчера Тэдом Сяо (главным спецом по робототехнике (Senior Research Scientist) в Google DeepMind Robotics).
Тэд написал так [4]:
«В ближайшие недели выйдет 3-4 крупных новости, которые потрясут сферу робототехники и искусственного интеллекта.
Скорректируйте свои планы, 2024 год будет сумасшедшим.»
О том же пишет и Джеймс Дарпиниан в лучшем на сегодня обзоре ТОР 20-тки андроидов мира [5]:
Святой Грааль - ходячий, говорящий и полезный андроид из научной фантастики, -внезапно оказывается в пределах досягаемости.
Так что, ждем революцию роботов в марте.
#Роботы
0 https://www.youtube.com/watch?v=PkTshLeC-R4
1 https://twitter.com/BerntBornich/status/1760546614530228450
2 https://www.youtube.com/watch?v=iHXuU3nTXfQ
3 https://spectrum.ieee.org/1x-robotics-video
4 https://twitter.com/xiao_ted/status/1760591701410799682
5 https://james.darpinian.com/blog/you-havent-seen-these-real-humanoid-robot-demos
Такого техно-прорыва не было со времен Прометея.
Суть ожидаемого прорыва – разрешение парадокса Моравека, несокрушимой стеной преграждающего путь к человекоподобному Сильному-ИИ (AGI), а потом и к Супер-ИИ.
Логика здесь проста:
• Для достижения уровня AGI, интеллектуальный агент должен иметь тело (именно оно будет «жить», адаптируясь к внешней среде и взаимодействуя с ней и себе подобными)
• Однако, на пути к отелесниванию ИИ стоит парадокс Моравека, согласно которому. управление низкоуровневыми сенсомоторными операциями (операциями тела) требует огромных вычислительных ресурсов, - даже больших, чем управление высококогнитивными процессами (сложными мысленными операциями мозга).
• Т.е. без человекоподобного тела (робота - андроида) не будет AGI, а для «жизни» андроиду не хватает вычислительных ресурсов.
Что обещают в марте.
Бернт Борних - СЕО компании 1Х (на которую OpenAI сделал ставку в робототехнике андроидов), - объявил, что в марте, похоже, будет доказано, что ограничение парадокса Моравека было ложное, и оно возникало всего лишь из-за банальной нехватки данных [1].
Речь, скорее всего, идет о выпуске андроида NEO - «брата» Евы (андроид EVE). NEO будет превосходить «сестру» во многом и кроме того, будет передвигаться на ногах, а не на колесах.
Январская демонстрация Евы (демонстрация [2] и ее разбор [0]) была настолько поразительной, что редакция IEEE Spectrum даже провела свое расследование – не прятались ли под костюмами андроидов люди. Но все оказалось чисто – не подкопаешься [3].
Фишка андроидов компании 1Х в движке, разработанном OpenAI. Это нейронка, как и разум человека, работает, учась на данных, поступающих от зрения, и генерирующая действия (управление движением, руками, захватами, туловищем и головой) с частотой 10 Гц.
«Базовая модель» понимает широкий спектр физического поведения: от уборки дома до сбора предметов на складе и социального взаимодействия с людьми и другими роботами. Но самое главное в том, что новые навыки появляются у андроида всего за несколько минут сбора данных и обучения, - путем наблюдения за тем, как это делают люди.
Для скептиков, сомневающихся в грядущем опровержении парадокса Моравека (даже если за этим видны уши OpenAI), рекомендую объявление, сделанное позавчера Тэдом Сяо (главным спецом по робототехнике (Senior Research Scientist) в Google DeepMind Robotics).
Тэд написал так [4]:
«В ближайшие недели выйдет 3-4 крупных новости, которые потрясут сферу робототехники и искусственного интеллекта.
Скорректируйте свои планы, 2024 год будет сумасшедшим.»
О том же пишет и Джеймс Дарпиниан в лучшем на сегодня обзоре ТОР 20-тки андроидов мира [5]:
Святой Грааль - ходячий, говорящий и полезный андроид из научной фантастики, -внезапно оказывается в пределах досягаемости.
Так что, ждем революцию роботов в марте.
#Роботы
0 https://www.youtube.com/watch?v=PkTshLeC-R4
1 https://twitter.com/BerntBornich/status/1760546614530228450
2 https://www.youtube.com/watch?v=iHXuU3nTXfQ
3 https://spectrum.ieee.org/1x-robotics-video
4 https://twitter.com/xiao_ted/status/1760591701410799682
5 https://james.darpinian.com/blog/you-havent-seen-these-real-humanoid-robot-demos
YouTube
OpenAI Eve Humanoid Robot: The Most Versatile and Autonomous Humanoid Robot Ever Created
1X Eve Robot Powered by OpenAI is a humanoid robot that can perform a variety of tasks autonomously, without any human intervention or guidance. In this video, you will see how the Eve robot can pick up and place objects, open doors, and even plug itself…
Богатейшее частное государство мира создаст воплощенных AGI-агентов для любого типа реальности.
Цель суперкоманды Джима Фана - чувствующие и понимающие агенты физического и виртуальных миров.
По доходам сегодняшняя NVIDIA – 12е государство мира. И при этом, это крупнейшее «частное государство» на свете [1].
И поэтому объявление компании о формировании исследовательской супер-команды GEAR (Generalist Embodied Agent Research), возглавляемой Джимом Фаном и Юкэ Чжу, с миссией - создание универсальных воплощенных агентов в физическом (робототехника) и виртуальных (игры и любые симуляции) мирах, - это самое важное событие в области ИИ первых 2х месяцев 2024 [2].
«Мы верим в будущее, в котором каждая движущаяся машина будет автономной, а роботы и смоделированные виртуальные агенты будут такими же вездесущими, как iPhone… Мы отправляемся в миссию по высадке на Луну, и до того, как мы туда доберемся, мы получим горы знаний и сделаем много открытий» - пишет Фан.
Джим Фан имеет веские основания так говорить. Ибо он [3]:
• самый известный в мире практик в деле создания ИИ-агентов (Voyager - первый ИИ-агент, который умело играет в Minecraft, MineDojo - агент с открытым исходным кодом, обучающийся, просматривая 100 000 видеороликов Minecraft на YouTube, Eureka - робот-рука с пятью пальцами, выполняющий чрезвычайно тонкие и сложные задачи) и VIMA - одна из первых базовых мультимодальных моделей фундамент для манипулирования роботами)
• с совершенно уникальной карьерой (он работал в OpenAI с Ильей Суцкевером и Андреем Карпати, в Baidu AI Labs с Эндрю Нг и Дарио Амодеем и в MILA с Йошуа Бенджио)
Принципиальное отличие AGI-агентов, разрабатываемых GEAR, в следующем:
Они будут универсально-воплощенными – способными учиться и «жить» в обоих типах миров (физическом и виртуальном/цифровом).
Это будет достигаться путем синтеза 3х типов данных: из материального мира, из ноосферы (Интернета) и синтетических данных (порождаемых «ИИ-спецагентами, типа Eureka, уже разработанного Фаном для NVIDIA [5])
Год назад я писал «Поворотный момент пройден - AGI появится через 1,5 года. Сработает сочетание больших денег, открытых фреймворков и превращение LLM в когнитивных агентов» [6].
И создание NVIDIA GEAR – важнейший шаг в воплощении этого прогноза.
#ВоплощенныйИнтеллект #AGI #Роботы
0 https://www.youtube.com/watch?v=URHt3p6tbrY
1 https://bit.ly/49MYj0d
2 https://research.nvidia.com/labs/gear/
3 https://jimfan.me/
4 https://bit.ly/3uO4O42
5 https://www.toolify.ai/ai-news/eureka-nvidias-revolutionary-ai-breakthrough-towards-agi-1542610
6 https://t.iss.one/theworldisnoteasy/1696
Цель суперкоманды Джима Фана - чувствующие и понимающие агенты физического и виртуальных миров.
По доходам сегодняшняя NVIDIA – 12е государство мира. И при этом, это крупнейшее «частное государство» на свете [1].
И поэтому объявление компании о формировании исследовательской супер-команды GEAR (Generalist Embodied Agent Research), возглавляемой Джимом Фаном и Юкэ Чжу, с миссией - создание универсальных воплощенных агентов в физическом (робототехника) и виртуальных (игры и любые симуляции) мирах, - это самое важное событие в области ИИ первых 2х месяцев 2024 [2].
«Мы верим в будущее, в котором каждая движущаяся машина будет автономной, а роботы и смоделированные виртуальные агенты будут такими же вездесущими, как iPhone… Мы отправляемся в миссию по высадке на Луну, и до того, как мы туда доберемся, мы получим горы знаний и сделаем много открытий» - пишет Фан.
Джим Фан имеет веские основания так говорить. Ибо он [3]:
• самый известный в мире практик в деле создания ИИ-агентов (Voyager - первый ИИ-агент, который умело играет в Minecraft, MineDojo - агент с открытым исходным кодом, обучающийся, просматривая 100 000 видеороликов Minecraft на YouTube, Eureka - робот-рука с пятью пальцами, выполняющий чрезвычайно тонкие и сложные задачи) и VIMA - одна из первых базовых мультимодальных моделей фундамент для манипулирования роботами)
• с совершенно уникальной карьерой (он работал в OpenAI с Ильей Суцкевером и Андреем Карпати, в Baidu AI Labs с Эндрю Нг и Дарио Амодеем и в MILA с Йошуа Бенджио)
Принципиальное отличие AGI-агентов, разрабатываемых GEAR, в следующем:
Они будут универсально-воплощенными – способными учиться и «жить» в обоих типах миров (физическом и виртуальном/цифровом).
Это будет достигаться путем синтеза 3х типов данных: из материального мира, из ноосферы (Интернета) и синтетических данных (порождаемых «ИИ-спецагентами, типа Eureka, уже разработанного Фаном для NVIDIA [5])
Год назад я писал «Поворотный момент пройден - AGI появится через 1,5 года. Сработает сочетание больших денег, открытых фреймворков и превращение LLM в когнитивных агентов» [6].
И создание NVIDIA GEAR – важнейший шаг в воплощении этого прогноза.
#ВоплощенныйИнтеллект #AGI #Роботы
0 https://www.youtube.com/watch?v=URHt3p6tbrY
1 https://bit.ly/49MYj0d
2 https://research.nvidia.com/labs/gear/
3 https://jimfan.me/
4 https://bit.ly/3uO4O42
5 https://www.toolify.ai/ai-news/eureka-nvidias-revolutionary-ai-breakthrough-towards-agi-1542610
6 https://t.iss.one/theworldisnoteasy/1696
Мартовская революция роботов началась.
Всего за пару недель Андроиды превратились в Гуманоидов.
Так ИИ-сингулярность сжимает масштаб времени в робототехнике.
Партнерству робототехнического стартапа FigureAI с OpenAI по разработке специальной разговорной модели для роботов – андроидов всего несколько недель. Но представленный вчера первый результат ошеломил публику.
Робот- андроид Figure 01, умевший в конце февраля самостоятельно учиться выполнять разнообразные физические задачи, к середине марта превратился в гуманоида. Он по-прежнему хорошо владеет руками, но теперь он еще и свободно болтает с людьми в процессе любой своей деятельности: как по делу (объясняя, что, как и зачем он делает), так и просто поговорить (хоть про него, хоть про людей, хоть про погоду).
Вот иллюстрация:
• короткое 2 мин демо от FigureAI [1]
• 20 мин видео анализ этого демо [2]
Три недели назад в посте о входе развития ИИ-систем в зону сингулярности я написал [3] -«Если в какой-то области все самое главное случается на последней неделе, - прогресс в этой области близок к сингулярности».
Полагаю, что до момента, когда робот - гуманоид типа Figure 01 будет владеть руками на уровне профессионального напёрсточника, нас также отделяет всего несколько недель. И всего-то надо перевести Figure 01 с языковой моделью от OpenAI с электромоторчиков на гидравлику, как это уже работает на андроиде Феникс от Sanctuary AI [4].
А 25 февраля я прогнозировал [5], что «Революция роботов намечена на март. Такого техно-прорыва не было со времен Прометея».
И вот она уже началась. Но общающийся с людьми гуманоид Figure 01- лишь1й шаг. За ним идет Нэо («брат» Евы от компании 1Х).
Вот тогда и рухнет, наконец, парадокс Моравека…
А будет это всего через несколько недель.
#Роботы
1 https://www.youtube.com/watch?v=Sq1QZB5baNw
2 https://www.youtube.com/watch?v=TMF8dqqLXro
3 https://t.iss.one/theworldisnoteasy/1898
4 https://www.youtube.com/watch?v=fDCRdwZUgIU
5 https://t.iss.one/theworldisnoteasy/1900
Всего за пару недель Андроиды превратились в Гуманоидов.
Так ИИ-сингулярность сжимает масштаб времени в робототехнике.
Партнерству робототехнического стартапа FigureAI с OpenAI по разработке специальной разговорной модели для роботов – андроидов всего несколько недель. Но представленный вчера первый результат ошеломил публику.
Робот- андроид Figure 01, умевший в конце февраля самостоятельно учиться выполнять разнообразные физические задачи, к середине марта превратился в гуманоида. Он по-прежнему хорошо владеет руками, но теперь он еще и свободно болтает с людьми в процессе любой своей деятельности: как по делу (объясняя, что, как и зачем он делает), так и просто поговорить (хоть про него, хоть про людей, хоть про погоду).
Вот иллюстрация:
• короткое 2 мин демо от FigureAI [1]
• 20 мин видео анализ этого демо [2]
Три недели назад в посте о входе развития ИИ-систем в зону сингулярности я написал [3] -«Если в какой-то области все самое главное случается на последней неделе, - прогресс в этой области близок к сингулярности».
Полагаю, что до момента, когда робот - гуманоид типа Figure 01 будет владеть руками на уровне профессионального напёрсточника, нас также отделяет всего несколько недель. И всего-то надо перевести Figure 01 с языковой моделью от OpenAI с электромоторчиков на гидравлику, как это уже работает на андроиде Феникс от Sanctuary AI [4].
А 25 февраля я прогнозировал [5], что «Революция роботов намечена на март. Такого техно-прорыва не было со времен Прометея».
И вот она уже началась. Но общающийся с людьми гуманоид Figure 01- лишь1й шаг. За ним идет Нэо («брат» Евы от компании 1Х).
Вот тогда и рухнет, наконец, парадокс Моравека…
А будет это всего через несколько недель.
#Роботы
1 https://www.youtube.com/watch?v=Sq1QZB5baNw
2 https://www.youtube.com/watch?v=TMF8dqqLXro
3 https://t.iss.one/theworldisnoteasy/1898
4 https://www.youtube.com/watch?v=fDCRdwZUgIU
5 https://t.iss.one/theworldisnoteasy/1900
YouTube
Figure Status Update - OpenAI Speech-to-Speech Reasoning
Очень скоро война превратится в 5=ю казнь апокалипсиса.
Против умной «саранчи в железных нагрудниках» все бессильно.
«И грудь у неё была, словно железная броня, а шум её крыльев был подобен грохоту множества колесниц, влекомых скакунами, рвущимися в бой.» Откровение 9:7—9)
По Библии, пятой казнью апокалипсиса будет «саранча в железных нагрудниках», против которой никто и ничто не устоит.
В технологическом переложении 20-го века непобедимость роя «железной саранчи» прекрасно описал Станислав Лем в романе «Непобедимый». Там даже самый мощный робот космического корабля со знаковым именем «Непобедимый», вооружённый системой силовых полей и сферическим излучателем антиматерии, оказался бессилен перед миллиардным роем крохотных летающих роботов.
В современном переложении об этом пишут Эллиот Акерман и адмирал Джеймс Ставридис:
• в формате эссе «Рои беспилотников изменят баланс военной мощи» [1]
• в формате романа «2054», в котором они размышляют о многих аспектах и роли ИИ в будущих военных конфликтах [2].
Ключевая идея этих авторов проста и безотбойна – сочетание роя дронов с ИИ кардинально меняет ход боя.
«По своей сути ИИ — это технология, основанная на распознавании образов. В военной теории взаимодействие между распознаванием образов и принятием решений известно как цикл НОРД — наблюдать, ориентироваться, решать, действовать. Теория петли (цикла) НОРД, разработанная в 1950-х годах летчиком-истребителем ВВС Джоном Бойдом, утверждает, что сторона в конфликте, которая сможет быстрее пройти через петлю НОРД, будет обладать решающим преимуществом на поле боя».
Для максимально быстрого прохождения петли НОРД нужно автономное и адаптивное оружие.
• Промышленные роботы являются примером автономных, но неадаптивных машин: они неоднократно выполняют одну и ту же последовательность действий.
• И наоборот, беспилотные дроны являются примером адаптивных, но неавтономных машин: они демонстрируют адаптивные возможности своих удаленных людей-операторов.
Рой дронов столь же адаптивен, но неавтономен, как и единственный дрон. Но для дрона-одиночки эта проблема решается его связкой с оператором (или примитивизацией функций). А для роя дронов такого числа операторов не напасешься (и функции упрощать не хочется). Но невозможно запустить тысячи автономных дронов, пилотируемых отдельными людьми. А вычислительные возможности ИИ делают такие рои возможными.
Если роем будет управлять ИИ, проблема адаптивности и автономности роя более не существует. Связка роя и ИИ станет самым быстрым исполнителем прохождения петли НОРД.
Акерман и Ставридис пишут:
«Это изменит ведение войны. Гонка будет вестись не за лучшие платформы, а за лучший ИИ, управляющий этими платформами. Это война циклов НОРД, рой против роя. Победит та сторона, которая разработает систему принятия решений на основе ИИ, способную опередить противника. Война движется к конфликту "мозг против мозга"»
И оба мозга будут электронные, - добавлю я от себя.
P.S. В одном Аккерман и Ставридис, имхо, ошибаются:
• Рои дронов с ИИ – это лишь ближняя перспектива (т.н. ПЖРы – полуживые роботы [3])
• В 2054, про который пишется в романе, ПЖР уже уступят место еще более интеллектуально продвинутому «жидкому мозгу» [4]
#БПЛА #Война #ИИ #Роботы
1 https://www.wsj.com/tech/drone-swarms-are-about-to-change-the-balance-of-military-power-e091aa6f
2 https://www.penguinrandomhouse.com/books/696977/2054-by-elliot-ackerman-and-admiral-james-stavridis/
3 https://t.iss.one/theworldisnoteasy/454
4 https://t.iss.one/theworldisnoteasy/654
Против умной «саранчи в железных нагрудниках» все бессильно.
«И грудь у неё была, словно железная броня, а шум её крыльев был подобен грохоту множества колесниц, влекомых скакунами, рвущимися в бой.» Откровение 9:7—9)
По Библии, пятой казнью апокалипсиса будет «саранча в железных нагрудниках», против которой никто и ничто не устоит.
В технологическом переложении 20-го века непобедимость роя «железной саранчи» прекрасно описал Станислав Лем в романе «Непобедимый». Там даже самый мощный робот космического корабля со знаковым именем «Непобедимый», вооружённый системой силовых полей и сферическим излучателем антиматерии, оказался бессилен перед миллиардным роем крохотных летающих роботов.
В современном переложении об этом пишут Эллиот Акерман и адмирал Джеймс Ставридис:
• в формате эссе «Рои беспилотников изменят баланс военной мощи» [1]
• в формате романа «2054», в котором они размышляют о многих аспектах и роли ИИ в будущих военных конфликтах [2].
Ключевая идея этих авторов проста и безотбойна – сочетание роя дронов с ИИ кардинально меняет ход боя.
«По своей сути ИИ — это технология, основанная на распознавании образов. В военной теории взаимодействие между распознаванием образов и принятием решений известно как цикл НОРД — наблюдать, ориентироваться, решать, действовать. Теория петли (цикла) НОРД, разработанная в 1950-х годах летчиком-истребителем ВВС Джоном Бойдом, утверждает, что сторона в конфликте, которая сможет быстрее пройти через петлю НОРД, будет обладать решающим преимуществом на поле боя».
Для максимально быстрого прохождения петли НОРД нужно автономное и адаптивное оружие.
• Промышленные роботы являются примером автономных, но неадаптивных машин: они неоднократно выполняют одну и ту же последовательность действий.
• И наоборот, беспилотные дроны являются примером адаптивных, но неавтономных машин: они демонстрируют адаптивные возможности своих удаленных людей-операторов.
Рой дронов столь же адаптивен, но неавтономен, как и единственный дрон. Но для дрона-одиночки эта проблема решается его связкой с оператором (или примитивизацией функций). А для роя дронов такого числа операторов не напасешься (и функции упрощать не хочется). Но невозможно запустить тысячи автономных дронов, пилотируемых отдельными людьми. А вычислительные возможности ИИ делают такие рои возможными.
Если роем будет управлять ИИ, проблема адаптивности и автономности роя более не существует. Связка роя и ИИ станет самым быстрым исполнителем прохождения петли НОРД.
Акерман и Ставридис пишут:
«Это изменит ведение войны. Гонка будет вестись не за лучшие платформы, а за лучший ИИ, управляющий этими платформами. Это война циклов НОРД, рой против роя. Победит та сторона, которая разработает систему принятия решений на основе ИИ, способную опередить противника. Война движется к конфликту "мозг против мозга"»
И оба мозга будут электронные, - добавлю я от себя.
P.S. В одном Аккерман и Ставридис, имхо, ошибаются:
• Рои дронов с ИИ – это лишь ближняя перспектива (т.н. ПЖРы – полуживые роботы [3])
• В 2054, про который пишется в романе, ПЖР уже уступят место еще более интеллектуально продвинутому «жидкому мозгу» [4]
#БПЛА #Война #ИИ #Роботы
1 https://www.wsj.com/tech/drone-swarms-are-about-to-change-the-balance-of-military-power-e091aa6f
2 https://www.penguinrandomhouse.com/books/696977/2054-by-elliot-ackerman-and-admiral-james-stavridis/
3 https://t.iss.one/theworldisnoteasy/454
4 https://t.iss.one/theworldisnoteasy/654
WSJ
Essay | Drone Swarms Are About to Change the Balance of Military Power
On today’s battlefields, drones are a manageable threat. When hundreds of them can be harnessed to AI technology, they will become a tool of conquest.
DeepMind подготовил эволюционный скачок в миропонимании роботов.
Найден простой и эффективный способ обучения роботов, как людей.
Представьте, что к вам впервые пришел сотрудник сервиса по генеральной уборке офисов. Вы водите его по всем помещениям, показываете, что и где нужно сделать и чего делать нельзя: тут вымыть, там пропылесосить, шторы в конференц зале постирать, санузлы дезинфицировать, весь мусор собрать, но на столах ничего не трогать, прочистить бытовую технику от кофемашин до кондиционеров и т.д. и т.п.
Т.е. вы просто все показываете и рассказываете. А работник, если что-то не понятно, переспрашивает и уточняет. Причем, работник толковый. И если ему, например, специально не показывали на флипчарты в переговорных, а просто в конце тура по офису добавили – оторви все исписанные листы на флипчартах и, не путая их порядок, сложи на стол перед дверью в архив, - сотрудник сам найдет все флипчарты и сделает ровно так, как ему сказано.
Примерно так же, но даже без реального тура по офису, а просто засняв его на смартфон со своими комментариями, мы очень скоро будем учить роботов.
Информация к размышлению.
Эволюционное развитие у млекопитающих способностей осмысления окружающей среды и целенаправленной навигации передвижений заняло более 200 млн лет.
На много порядков меньшее время (всего какие-то несколько сотен тысяч лет) потребовалось для следующего «эволюционного скачка» в развитии самого когнитивно одаренного млекопитающего – людей. На освоение ими языков абстрактных понятий эволюции (уже не генной, а генно-культурной) потребовалось всего лишь несколько сотен тысяч лет.
У формирующегося на Земле нового небиологического (цифрового) вида эти процессы:
1. во-первых, идут с несопоставимо огромной скоростью;
2. а во-вторых, имеют обратную последовательность.
Последнее оказалось возможным из-за нематериальности и бестелесности «цифровых сущностей» генеративного ИИ на основе больших языковых моделей.
Сначала, они всего за пару лет эволюционировали до уровня людей в оперировании языками абстрактных понятий. А теперь, вселясь в тела роботов, они, скорее всего, за какие-то месяцы сделают второй «эволюционный скачок» – став «материализованными цифровыми сущностями».
Вместе с обретением тел они обретут способности осмысления окружающей среды и навигации своих передвижений в соответствии с намерениями и целями.
Представленная Google DeepMind система обучения роботов объединяет подсистему «мультимодальной навигации по инструкциям с демонстрационными турами (MINT)» и подсистему «интеграции зрения, языка и действий» Vision-Language-Action (VLA). Это объединение позволило интегрировать понимание окружающей среды и силу рассуждений на основе здравого смысла больших языковых моделей с огромным контекстным окном в 1.5 млн токенов.
Проще говоря, гении из DeepMind разработали способ, с помощью которого роботы понимают и ориентируются в сложных средах, используя комбинацию слов, изображений и видеотуров. При этом роботы могут получать от людей команды на выполнение действий в сложных средах мультимодально: устно, письменно, в виде картинок (карты, планы, схемы, идеограммы и т.д.), а также на основе жестов людей (типа объяснений на пальцах) и (в следующей версии) их мимики.
На представленных Google демо их система Mobility VLA на основе Gemini 1.5 Pro интеллектуально обходит GPT-4o и GPT-4V.
Напр. на обращение к роботу «Хочу еще вот этого» с показом пальцем на пустую банку колы, робот с Mobility VLA сам нашел холодильник, где этого добра было много. С чем прочие модели справились плохо (одни не поняли, что надо, другие – где это взять).
Картинка: архитектура Mobility VLA и сравнение с другими моделями https://telegra.ph/file/cc78760f7102b6b803bf2.jpg
Статья https://arxiv.org/abs/2407.07775
Видео демо https://x.com/GoogleDeepMind/status/1811401347477991932
#роботы
Найден простой и эффективный способ обучения роботов, как людей.
Представьте, что к вам впервые пришел сотрудник сервиса по генеральной уборке офисов. Вы водите его по всем помещениям, показываете, что и где нужно сделать и чего делать нельзя: тут вымыть, там пропылесосить, шторы в конференц зале постирать, санузлы дезинфицировать, весь мусор собрать, но на столах ничего не трогать, прочистить бытовую технику от кофемашин до кондиционеров и т.д. и т.п.
Т.е. вы просто все показываете и рассказываете. А работник, если что-то не понятно, переспрашивает и уточняет. Причем, работник толковый. И если ему, например, специально не показывали на флипчарты в переговорных, а просто в конце тура по офису добавили – оторви все исписанные листы на флипчартах и, не путая их порядок, сложи на стол перед дверью в архив, - сотрудник сам найдет все флипчарты и сделает ровно так, как ему сказано.
Примерно так же, но даже без реального тура по офису, а просто засняв его на смартфон со своими комментариями, мы очень скоро будем учить роботов.
Информация к размышлению.
Эволюционное развитие у млекопитающих способностей осмысления окружающей среды и целенаправленной навигации передвижений заняло более 200 млн лет.
На много порядков меньшее время (всего какие-то несколько сотен тысяч лет) потребовалось для следующего «эволюционного скачка» в развитии самого когнитивно одаренного млекопитающего – людей. На освоение ими языков абстрактных понятий эволюции (уже не генной, а генно-культурной) потребовалось всего лишь несколько сотен тысяч лет.
У формирующегося на Земле нового небиологического (цифрового) вида эти процессы:
1. во-первых, идут с несопоставимо огромной скоростью;
2. а во-вторых, имеют обратную последовательность.
Последнее оказалось возможным из-за нематериальности и бестелесности «цифровых сущностей» генеративного ИИ на основе больших языковых моделей.
Сначала, они всего за пару лет эволюционировали до уровня людей в оперировании языками абстрактных понятий. А теперь, вселясь в тела роботов, они, скорее всего, за какие-то месяцы сделают второй «эволюционный скачок» – став «материализованными цифровыми сущностями».
Вместе с обретением тел они обретут способности осмысления окружающей среды и навигации своих передвижений в соответствии с намерениями и целями.
Представленная Google DeepMind система обучения роботов объединяет подсистему «мультимодальной навигации по инструкциям с демонстрационными турами (MINT)» и подсистему «интеграции зрения, языка и действий» Vision-Language-Action (VLA). Это объединение позволило интегрировать понимание окружающей среды и силу рассуждений на основе здравого смысла больших языковых моделей с огромным контекстным окном в 1.5 млн токенов.
Проще говоря, гении из DeepMind разработали способ, с помощью которого роботы понимают и ориентируются в сложных средах, используя комбинацию слов, изображений и видеотуров. При этом роботы могут получать от людей команды на выполнение действий в сложных средах мультимодально: устно, письменно, в виде картинок (карты, планы, схемы, идеограммы и т.д.), а также на основе жестов людей (типа объяснений на пальцах) и (в следующей версии) их мимики.
На представленных Google демо их система Mobility VLA на основе Gemini 1.5 Pro интеллектуально обходит GPT-4o и GPT-4V.
Напр. на обращение к роботу «Хочу еще вот этого» с показом пальцем на пустую банку колы, робот с Mobility VLA сам нашел холодильник, где этого добра было много. С чем прочие модели справились плохо (одни не поняли, что надо, другие – где это взять).
Картинка: архитектура Mobility VLA и сравнение с другими моделями https://telegra.ph/file/cc78760f7102b6b803bf2.jpg
Статья https://arxiv.org/abs/2407.07775
Видео демо https://x.com/GoogleDeepMind/status/1811401347477991932
#роботы
Революция Tesla в области автономных роботов.
Запатентован иной способ зрительного восприятия, отличный от придуманных эволюцией на Земле.
Tesla только что подала патент на систему зрительного восприятия окружающего мира мыслящими субъектами на базе ИИ (называемыми «эго») [1]
Это новая система зрения отличается от всех сформировавшихся эволюционно на Земле способов и механизмов зрения и названа Voxel-Based Vision (VBV) - зрение, основанное на вокселях.
Особенности VBV таковы.
• Кардинально меняется то, как автономные роботы воспринимают и ориентируются в окружающей среде: используются только данные с камеры без использования лидара или радара.
• VBV делит пространство на трехмерные воксели, прогнозируя занятость, форму, семантические данные и движение для каждого вокселя в режиме реального времени.
VBV предназначена для работы на бортовом компьютере робота (как в автомобили Tesla, так и в человекоподобных роботах, типа Optimus, и позволяет принимать решения о действиях в пространстве практически мгновенно (в реальном времени).
VBV позволяет роботу самостоятельно и без предварительной подготовки ориентироваться в разнообразных средах и адаптироваться к изменениям в реальном времени. Это устраняет необходимость в обширном предварительном картографировании и ускоряет появление доступных автономных роботов.
Революционную суть изобретенной технологии можно также сформулировать так.
✔️ Процесс зрения (видения) происходит не в глазах, а в мозге.
✔️ Т.к. способность видеть окружающий мир столь полезна, эволюция сформировала процессы видения множество раз и по разным траекториям (для разных животных).
✔️ Например, глаза осьминога поразительно похожи на наши (и это при том, что нашим последним общим предком было слепое морское существо, типа слизняка или улитки, жившее более полумиллиарда лет назад).
✔️ Однако VBV в принципе отличается от всех придуманных эволюцией траекторий, будучи оптимален для ИИ, а не для биологического мозга.
Прототип VBV был доложен на конференции год назад [2].
За год систему довели и теперь запатентовали.
Картинка https://telegra.ph/file/b2fc96180b2a233836c19.jpg
1 https://x.com/seti_park/status/1819406901257568709
2 https://www.youtube.com/watch?v=6x-Xb_uT7ts
#Роботы #Зрение
Запатентован иной способ зрительного восприятия, отличный от придуманных эволюцией на Земле.
Tesla только что подала патент на систему зрительного восприятия окружающего мира мыслящими субъектами на базе ИИ (называемыми «эго») [1]
Это новая система зрения отличается от всех сформировавшихся эволюционно на Земле способов и механизмов зрения и названа Voxel-Based Vision (VBV) - зрение, основанное на вокселях.
Особенности VBV таковы.
• Кардинально меняется то, как автономные роботы воспринимают и ориентируются в окружающей среде: используются только данные с камеры без использования лидара или радара.
• VBV делит пространство на трехмерные воксели, прогнозируя занятость, форму, семантические данные и движение для каждого вокселя в режиме реального времени.
VBV предназначена для работы на бортовом компьютере робота (как в автомобили Tesla, так и в человекоподобных роботах, типа Optimus, и позволяет принимать решения о действиях в пространстве практически мгновенно (в реальном времени).
VBV позволяет роботу самостоятельно и без предварительной подготовки ориентироваться в разнообразных средах и адаптироваться к изменениям в реальном времени. Это устраняет необходимость в обширном предварительном картографировании и ускоряет появление доступных автономных роботов.
Революционную суть изобретенной технологии можно также сформулировать так.
✔️ Процесс зрения (видения) происходит не в глазах, а в мозге.
✔️ Т.к. способность видеть окружающий мир столь полезна, эволюция сформировала процессы видения множество раз и по разным траекториям (для разных животных).
✔️ Например, глаза осьминога поразительно похожи на наши (и это при том, что нашим последним общим предком было слепое морское существо, типа слизняка или улитки, жившее более полумиллиарда лет назад).
✔️ Однако VBV в принципе отличается от всех придуманных эволюцией траекторий, будучи оптимален для ИИ, а не для биологического мозга.
Прототип VBV был доложен на конференции год назад [2].
За год систему довели и теперь запатентовали.
Картинка https://telegra.ph/file/b2fc96180b2a233836c19.jpg
1 https://x.com/seti_park/status/1819406901257568709
2 https://www.youtube.com/watch?v=6x-Xb_uT7ts
#Роботы #Зрение
Обойдя Японию и Германию, Китай теперь №3.
А США покинули десятку лидеров.
Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
А США покинули десятку лидеров.
Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
Созданы первые биомиметические роботы, как в «Мире Дикого Запада».
Clone Alpha - гуманоидный робот с синтетическими органами и искусственными мышцами, работающими на воде.
Еще и еще раз буду повторять это: вхождение техно-прогресса в область сингулярности сжимает время до появления очередной прорывной техно-новации с десятилетий до дней.
Вот кто мог подумать, что биомиметические роботы, как в «Мире Дикого Запада», появятся не через десятилетия, а спустя всего несколько месяцев после моего поста о «революции роботов»?
К концу 2024 уже никого не удивляют человекоподобные фигуры и передвижения роботов андроидов. Но вот представить среди нас андроидов с биомиметической архитектурой еще год назад могли лишь сценаристы Голливуда.
А слово биомиметическая в названии архитектуры этих роботов означает использование синтетических версий систем органов человека:
• искусственные мышцы, называемые миофибрами, которые сокращаются под действием давления воды (миофибры могут сокращаться на 30% менее чем за 50 миллисекунд, создавая при этом килограмм силы всего из трех граммов материала);
• полимерный скелет с 206 аналогами костей (сочлененных суставами с искусственными связками с десятками степеней свободы) и гидравлической «сосудистой системой», работающей от компактного полукиловаттного насоса;
• нервная система на базе «Cybernet», визуально-моторной модели Clone, с четырьмя камерами глубины для отслеживания окружающей среды.
Все это, по словам разработчиков, обеспечивает скорость, точность и ловкость движений роботов, делающих их неотличимыми от людей.
«По словам разработчиков» означает, что биомиметический андроид Clone Alpha засекречен донельзя, и потому журналистам его пока не показывают.
Известно лишь, что:
• биомиметическая рука этого андроида прошла испытания и показывалась в действии (ловко махала 7-килограммовой гантелей);
• заказы на первые 3 сотни целиковых андроидов Clone Alpha принимаются с исполнением в первом полугодии 2025 (про цену лишь слухи).
Пока же все с нетерпением ждут демонстрацию и больше информации. Ибо, если объявленное подтвердится, то уже в 2025 могут появиться первые варианты проектов, типа показанного в сериале «Мир Дикого Запада».
#Роботы
Clone Alpha - гуманоидный робот с синтетическими органами и искусственными мышцами, работающими на воде.
Еще и еще раз буду повторять это: вхождение техно-прогресса в область сингулярности сжимает время до появления очередной прорывной техно-новации с десятилетий до дней.
Вот кто мог подумать, что биомиметические роботы, как в «Мире Дикого Запада», появятся не через десятилетия, а спустя всего несколько месяцев после моего поста о «революции роботов»?
К концу 2024 уже никого не удивляют человекоподобные фигуры и передвижения роботов андроидов. Но вот представить среди нас андроидов с биомиметической архитектурой еще год назад могли лишь сценаристы Голливуда.
А слово биомиметическая в названии архитектуры этих роботов означает использование синтетических версий систем органов человека:
• искусственные мышцы, называемые миофибрами, которые сокращаются под действием давления воды (миофибры могут сокращаться на 30% менее чем за 50 миллисекунд, создавая при этом килограмм силы всего из трех граммов материала);
• полимерный скелет с 206 аналогами костей (сочлененных суставами с искусственными связками с десятками степеней свободы) и гидравлической «сосудистой системой», работающей от компактного полукиловаттного насоса;
• нервная система на базе «Cybernet», визуально-моторной модели Clone, с четырьмя камерами глубины для отслеживания окружающей среды.
Все это, по словам разработчиков, обеспечивает скорость, точность и ловкость движений роботов, делающих их неотличимыми от людей.
«По словам разработчиков» означает, что биомиметический андроид Clone Alpha засекречен донельзя, и потому журналистам его пока не показывают.
Известно лишь, что:
• биомиметическая рука этого андроида прошла испытания и показывалась в действии (ловко махала 7-килограммовой гантелей);
• заказы на первые 3 сотни целиковых андроидов Clone Alpha принимаются с исполнением в первом полугодии 2025 (про цену лишь слухи).
Пока же все с нетерпением ждут демонстрацию и больше информации. Ибо, если объявленное подтвердится, то уже в 2025 могут появиться первые варианты проектов, типа показанного в сериале «Мир Дикого Запада».
#Роботы