Ну что ж, рабочая неделя подходит к концу, а значит можно наконец от души погрузиться в папирусы и эксперименты. Сегодня два вкуснейших рисерча, которые (конечно же cherrypicked) толкают вперед повесточку автора этого канала:
1. Про то как агенты, работая вместе получили 2х более крутые результаты решая программерские задачи.
2. Про то, как агенты могутзаниматься сексом создавать себе подобных, и про то, что, скорее всего, большинство ИИ-агентов в мире будут именно такими.
Остановлюсь на втором. Авторы верно утверждают, что в ML любая ручная оптимизация рано или поздно заменяется автоматизированной, выученной. Они предлагают новую дизайн парадигму, в которой фактически LLM поизводит поиск новых агентов в бесконечном и латентном пространстве всех возможных программ постепенно находя решения, которые все лучше и лучше решают определенную задачу.
Это близко к подходу, который получил наивысший резузльтат в "ультимативном тесте на AGI" - ARC challenge, где LLM производят дискретный поиск программ для решения каждой из логических задач. Более того, авторы применяют свой подход, в том числе, и к этому челенджу. В итоге они получили более крутые показатели точности по сравнению со всеми популярными сегодня агентскими методами типа chain-of-though, self-critique, debate, etc.
(Немного гипертрофированный) вывод: агенты, а не просто модели, дадут те самые триллионы эффективности в экономике, а агентов будут миллионы и миллиарды, они будут создавать сами себя и жить в интернете.
#KeepCalm #AgentsAreComing
_______
Источник | #cryptoEssay
@F_S_C_P
1 Blum = $0.019:
Попробуй Blum
1. Про то как агенты, работая вместе получили 2х более крутые результаты решая программерские задачи.
2. Про то, как агенты могут
Остановлюсь на втором. Авторы верно утверждают, что в ML любая ручная оптимизация рано или поздно заменяется автоматизированной, выученной. Они предлагают новую дизайн парадигму, в которой фактически LLM поизводит поиск новых агентов в бесконечном и латентном пространстве всех возможных программ постепенно находя решения, которые все лучше и лучше решают определенную задачу.
Это близко к подходу, который получил наивысший резузльтат в "ультимативном тесте на AGI" - ARC challenge, где LLM производят дискретный поиск программ для решения каждой из логических задач. Более того, авторы применяют свой подход, в том числе, и к этому челенджу. В итоге они получили более крутые показатели точности по сравнению со всеми популярными сегодня агентскими методами типа chain-of-though, self-critique, debate, etc.
(Немного гипертрофированный) вывод: агенты, а не просто модели, дадут те самые триллионы эффективности в экономике, а агентов будут миллионы и миллиарды, они будут создавать сами себя и жить в интернете.
#KeepCalm #AgentsAreComing
_______
Источник | #cryptoEssay
@F_S_C_P
1 Blum = $0.019:
Попробуй Blum