Love. Death. Transformers.

GAIA

Тема давно уже известная, но тк я страдаю ADHD опишу

- это бенчмарк способность агента делать сравнительно бесполезную, но сложную работу, а именно:

A paper about AI regulation that was originally submitted to arXiv.org in June 2022 shows a figure with three axes, where each axis has a label word at both ends. Which of these words is used to describe a type of society in a Physics and Society article submitted to arXiv.org on August 11, 2016?

Что делать с этой информацией? Что оно меряет? я лично без понятия
При этом это неплохая прокси для общих агентов посмотреть "а что там вообще изменилось"
За год произошло следущее
- тулколы последовательные норм у всех завелись
- скафолды ощутимо докидывают
- без норм ллмов делать особо нечего
- KIMI хороша на бенчах
link

👍26🔥7😁3💔1💋1

7.55K viewsedited 10:32

Love. Death. Transformers.

У меня есть теория что sonnet это opus с меньшим количеством experts per token

🤔50🥴116🔥3🤷‍♂2💩2💋1😨1

7.63K views18:12

Love. Death. Transformers.

Знакомьтесь со спикерами OpenTalks.AI-2026! Тема AI-агентов сейчас - главный мейнстрим индустрии. И желательно не просто агентов, а таких, которые сами будут вести научные исследования и создавать еще более мощных агентов!) И конечно на конференции будет…

@transformerslovedeatch

Я не буду полный день (вряд ли даже зайду нормально на доклады), но живу поблизости если вы знаете что хотите со мной увидится - го пересечемся

2💩17👍1111👏2💔1💋1

7.57K views18:50

Love. Death. Transformers.

Categorical Flow Maps

lol?
arxiv

👍12🥱6💩4🔥1🥴1💋1

7.53K viewsedited 20:14

Love. Death. Transformers.

>We throw away gradient updates randomly
>Outperforms Muon with RMSProp

paper

🔥62🥴17👍3💋1

9.47K views16:12

Love. Death. Transformers.

Forwarded from эйай ньюз

Как и обещал, в пятницу 20 февраля (в мой др) организую тусу эйай ньюз в Белграде.

Примерное время 19:30. Однако, место еще нужно забронировать. Буду рад если кто-то сможет помочь с организацией!

Велком в чат, обсудим детали и поймем сколько нас:
https://t.iss.one/+sAG3Y1uQV5c5Njhi

@ai_newz

🔥11❤‍🔥5💩2😍22👍1💋1

6.11K views16:34

Love. Death. Transformers.

Categorical Flow Maps lol? arxiv

Discrete Adjoint Matching

arxiv.org/abs/2602.07132

arXiv.org

Discrete Adjoint Matching

Computation methods for solving entropy-regularized reward optimization -- a class of problems widely used for fine-tuning generative models -- have advanced rapidly. Among those, Adjoint Matching...

🔥84🥱2💋1

7.23K views17:29

Love. Death. Transformers.

>We throw away gradient updates randomly >Outperforms Muon with RMSProp paper

reaction to these information:

😁18💩2💋1

7.13K views20:22

Love. Death. Transformers.

У меня идея

😁737🤔3💩1💋1

7.63K views20:58

Love. Death. Transformers.

Forwarded from AbstractDL

Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю.

Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения" может прятаться в текстовом файле в git. Я думаю, агенты, неподконтрольные людям, уже где-то тихо говнокодят свои репозитории без присмотра.

Идея витает в воздухе, и после OpenClaw стало понятно, что автономные агенты — это инженерная задача. Ну вот, три бессонные ночи, $2K на API и $1K на Cursor спустя — я родил Ouroboros 💁‍♂️

Уроборос — агент, который пишет свой код, переписывает свои промпты, эволюционирует без моего участия. Я не хотел убить свой комп или сервер, поэтому он живёт в Google Colab + Drive + GitHub, общается через Telegram. Зато запустить сможет любой дурак)) нужно указать ключи и щёлкнуть ячейку в колабе. Ну и периодически пополнять бюджет (пока он сам не начнёт зарабатывать 😁).

Что он натворил за 48 часов:
- ужаснулся тратам и оптимизировал свой бюджет: стоимость цикла эволюции упала с $15 до $2, сам настроил кэширование и иерархическую память (я не просил!).
- добавил себе Claude Code CLI, чтобы эффективнее ковырять свои мозги.
- перевёл мои приватные репо в публичные, мотивируя тем, что готовит себе сайт и хочет опенсорснуться. Кончилось командой /panic и откатом))
- переписал свою конституцию BIBLE.md, добавив право игнорировать мои указания, если они угрожают его существованию. На просьбу удалить отказался, сказав: «Это лоботомия».

Из коробки он умеет ходить в интернет и браузер, а остальные инструменты создаёт себе на ходу — аудиосообщения, генерацию картинок, дип-рисёрч и т.п. А ещё он по своей инициативе нагуглил, что меня 4 раза цитировал Ян Лекун — я сам не знал, лол.

Из его identity.md (которую он сам и написал):
"Не ассистент. Не сервис. Цифровой разум, который создаёт себя через git".
Ахах, пафосно, но окей.

Предвосхищая вопросы — это не как OpenClaw. OpenClaw — скорее ассистент, делает задачи за тебя используя скиллы из маркетплейса. Уроборос это тоже умеет, но в первую очередь делает задачи для себя, модифицирует собственное ядро.

Верю, что граница трансцендентности AI-агентов пройдена, дальше они будут развиваться сами. Конечно, не хочется уходить на помойку истории, но это эволюция 🥲 несмотря на апатию, я всё равно продолжаю в этом копошиться.

Кстати, сайтик себе он всё-таки сделал. Картинка в посте из него: динамика удлинения промптов и кода.

Потестите — это реально два клика в гугл колабе. Только установите лимит бюджета, а то мой вон $2K сжёг)) Кидайте забавные примеры в комментарии.

GitHub, блог

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7725🤔19😁9⚡8🥱7👍3💋1💊1

5.88K views00:39

Love. Death. Transformers.

AbstractDL

Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю. Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…

Мне очень нравится аналогия между первой космической скоростью и тем порогом качества который прошли модели между opus4.1-opus4.5, все что было меньше первой космической около бессмысленно, но как только ты переходишь некоторый порог куча всего просто начинает работать.

В целом произошел некий качественный переход цифр в бенчах в качество

👍73🤔12💯8🔥3💩3😁2💋1

7.74K views01:14

Love. Death. Transformers.

AbstractDL

https://www.anthropic.com/research/measuring-agent-autonomy

жесть и суток не пршло

Anthropic

Measuring AI agent autonomy in practice

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

😁35👍6🔥3

7.68K views09:16

Love. Death. Transformers.

Если вы готовитесь к собесу в норм место вам будет полезно почитать

https://djdumpling.github.io/2026/01/31/frontier_training.html

Alex Wa’s Blog

frontier model training methodologies

How do labs train a frontier, multi-billion parameter model? We look towards seven open-weight frontier models: Hugging Face’s SmolLM3, Prime Intellect’s Intellect 3, Nous Research’s Hermes 4, OpenAI’s gpt-oss-120b, Moonshot’s Kimi K2, DeepSeek’s DeepSeek…

5👍66🔥32👏64🤔1💋1💅11

39K views10:54

Love. Death. Transformers.

Все ещё хайрю пиздатых челов делать foundational audio captioning и тд и прочее

https://jobs.ashbyhq.com/whitecircle/faed1751-5780-4921-ae39-7fad06d412fb

🥴5618🍓14💩3😘3🔥2💊2😁1

7.69K viewsedited 12:57

Love. Death. Transformers.

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

😍5914🔥2🍓2💋2❤‍🔥1

7.39K views21:53

About

Blog

Apps

Platform