"Развитие алгоритмов обучения с подкреплением
1 Введение
Разработка новых алгоритмов глубокого обучения с подкреплением, которые могут эффективно решать самые разнообразные задачи, как правило, требует огромного количества ручных усилий. Обучение разработке алгоритмов обучения
подкреплению или даже небольших субкомпонентов алгоритмов поможет облегчить эту
нагрузку и может привести к созданию более совершенных алгоритмов, чем исследователи могли бы разработать вручную. Тогда наша работа может перейти
от разработки этих алгоритмов вручную к разработке языка и
методов оптимизации для автоматической разработки этих алгоритмов.
Алгоритмы обучения с подкреплением можно рассматривать как процедуру, которая сопоставляет опыт агента
с политикой, которая получает высокую совокупную награду в течение обучения..."
1 Введение
Разработка новых алгоритмов глубокого обучения с подкреплением, которые могут эффективно решать самые разнообразные задачи, как правило, требует огромного количества ручных усилий. Обучение разработке алгоритмов обучения
подкреплению или даже небольших субкомпонентов алгоритмов поможет облегчить эту
нагрузку и может привести к созданию более совершенных алгоритмов, чем исследователи могли бы разработать вручную. Тогда наша работа может перейти
от разработки этих алгоритмов вручную к разработке языка и
методов оптимизации для автоматической разработки этих алгоритмов.
Алгоритмы обучения с подкреплением можно рассматривать как процедуру, которая сопоставляет опыт агента
с политикой, которая получает высокую совокупную награду в течение обучения..."
This media is not supported in your browser
VIEW IN TELEGRAM
'da vinci drawing of building with wings and insect legs'
GAN prompting
CLIP x BigGAN
GAN prompting
CLIP x BigGAN
This media is not supported in your browser
VIEW IN TELEGRAM
"Player-AI Interaction: What Neural Network Games Reveal About AI as Play"
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Geometric Level of Detail:
Real-time Rendering with Implicit 3D Surfaces
Real-time Rendering with Implicit 3D Surfaces
Forwarded from Graph Machine Learning
RoboGrammar: Graph Grammar for Terrain-Optimized Robot Design
(video) A recent work done at MIT for constructing different robot designs via graph grammar. Graph grammars were introduced in 1992 and defines a set of rules of transforming one graph to another. With this, a user can specify input robot components as well as the type of the terrain and graph grammar will produce possible robot designs. Next, a variation of A* algorithm is used to search for the optimal robot design for a given terrain. More on this in this article.
(video) A recent work done at MIT for constructing different robot designs via graph grammar. Graph grammars were introduced in 1992 and defines a set of rules of transforming one graph to another. With this, a user can specify input robot components as well as the type of the terrain and graph grammar will produce possible robot designs. Next, a variation of A* algorithm is used to search for the optimal robot design for a given terrain. More on this in this article.
YouTube
RoboGrammar: Graph Grammar for Terrain-Optimized Robot Design
ACM SIGGRAPH Asia 2020
https://cdfg.mit.edu/publications/robogrammar-graph-grammar-for-terrain-optimized-robot-design
https://cdfg.mit.edu/publications/robogrammar-graph-grammar-for-terrain-optimized-robot-design
This media is not supported in your browser
VIEW IN TELEGRAM
Shelf-Supervised Mesh Prediction in the Wild
This media is not supported in your browser
VIEW IN TELEGRAM
NeRF−−: Neural Radiance Fields Without Known
Media is too big
VIEW IN TELEGRAM
Искусственная среда как трансформация естественной
This media is not supported in your browser
VIEW IN TELEGRAM
ShaRF: Shape-conditioned Radiance Fields from a Single View
This media is not supported in your browser
VIEW IN TELEGRAM
Mastering Atari with Discrete World Models
"Глубокое обучение с подкреплением (RL) позволяет искусственным агентам со временем улучшать свои решения. Традиционные безмодельные подходы изучают, какие действия являются успешными в различных ситуациях, путем взаимодействия с окружающей средой с помощью большого количества проб и ошибок..."
"Глубокое обучение с подкреплением (RL) позволяет искусственным агентам со временем улучшать свои решения. Традиционные безмодельные подходы изучают, какие действия являются успешными в различных ситуациях, путем взаимодействия с окружающей средой с помощью большого количества проб и ошибок..."
This media is not supported in your browser
VIEW IN TELEGRAM
Encoding memory in tube diameter hierarchy of living flow network
Значимость
"Простым организмам удается процветать в сложных условиях. Память об окружающей среде - ключ к принятию обоснованных решений. Physarum polycephalum выделяется как гигантский одноклеточный эукариот, способный даже решать задачи оптимизации..."
Значимость
"Простым организмам удается процветать в сложных условиях. Память об окружающей среде - ключ к принятию обоснованных решений. Physarum polycephalum выделяется как гигантский одноклеточный эукариот, способный даже решать задачи оптимизации..."
This media is not supported in your browser
VIEW IN TELEGRAM
Bio-inspired Approaches for Modular Robotics
This media is not supported in your browser
VIEW IN TELEGRAM
Covariance Matrix Adaptation Evolution Strategy