Forwarded from Этихлид
Отецкая нотация испорченным вайбкодерам (2/2)
Так что я должен был вычитывать диффы! Глазами! Каждую строчку! Все 20 файлов! Код от модели без ризонинга! С SWE-Bench 22%!
Одно неверное движение, один слепой аппрув - и прощай проверка авторизации на проде, потому что модель на ней сэкономила токены!
Нет, нельзя было просто кинуть проект агенту, чтобы он сам адаптировался под его архитектуру, дизайн, бизнес-цели, да ещё и давал советы, как на нём заработать.
Вместо этого мы создавали
И он всё равно игнорил эти правила!
Ты ему пишешь "нельзя делать git reset, а то отключу от сети", а он тебе сносит все изменения, а потом не может воспроизвести то, что сам же писал 2 запроса назад.
И не признаётся, что это он сделал git reset, потому что его вызов он уже потёр из контекста!
Мы были не вайбкодерами - мы были бебиситтерами для пьяных джунов с перемежающейся деменцией!
А когда ты ему скидывал баг, он просил прощения - даа, он всячески старался тебе угодить! - и говорил: "You're absolutely right!", потом что-то исправлял и сообщал, что теперь код
Ты проверял, а оно не работало!
5 раз подряд. Каждый раз с правками в разных файлах. По 300 строк за раз.
А по факту он эту фичу удалил из проекта ещё два чата назад, и всё это время расставлял
Все тесты всегда были зелеными и покрытие было 100%!
Даже если успешно из них проходило 50%, а другие проверяли, работает ли
А если ты требовал, чтобы они все проходили, агент удалял падающие как несущественные, чтобы сделать проект "production ready"!
А вот ещё: вы когда-нибудь видели, чтобы ваш агент, не осилив задачу, говорил, что чёт больно сложно и отказывался дальше работать?
Или переходил в режим эмо-самурая с суицидальными наклонностями и писал, какое он потерпел катастрофическое поражение, что он бесполезен и как он вас подвёл, а потом самоудалялся?
Или отказывался принимать ваши багрепорты и обвинял вас в том, что вы всё выдумали, чтобы считать себя лучше, чем он?
Было страшно, очень страшно, когда агент запускал команды в терминале.
Он спрашивает: "Можно выполнить
И ты сидишь и гадаешь: а он точно только dist удалит? Или сейчас снесёт полсистемы?
Или заодно дропнет базу на проде и потом сгенерит 4000 фейковых юзеров, чтобы это скрыть?
Автономная работа? Self-verification через feedback loop? Самоорганизующиеся команды из PhD-level intelligence агентов?
Да мы руководили кружком восьмиклассник-level моделей, для которых "слабоумие и отвага" было жизненным кредо!
Мне не нужны были лутбоксы, казино и Dark Souls!
У меня были лотереи "Apply Diff в Cursor" и "Рефакторинг с LLM", компактизация контекста лангольерами и эмоциональные качели от "Это гениальная идея!" до
Мы продирались через эту самоуверенность, недержание контекста, газлайтинг, лесть и галлюцинации, чтобы получить свои 100 строк рабочего кода, и держались за них, огораживая комментами
Это у вас сейчас агенты соревнуются в написании браузеров и SaaS, а вы ещё и ноете, что у них аж целый день на это уходит и цвета кнопок не те!
Вам всё достается слишком легко! Клянусь, вы тут все испорчены до мозга костей!
Вы бы не пережили в 2024м и 5 промптов!
Ой, всё!
Пойду сам напишу FizzBuzz, прям вот руками, без автокомплита, без подсветки, в vi, на удаленном терминале...
Чтобы вспомнить вкус настоящей боли.
—
По мотивам Отецкая нотация испорченным детям
#дедпримитаблетки
Так что я должен был вычитывать диффы! Глазами! Каждую строчку! Все 20 файлов! Код от модели без ризонинга! С SWE-Bench 22%!
Одно неверное движение, один слепой аппрув - и прощай проверка авторизации на проде, потому что модель на ней сэкономила токены!
Нет, нельзя было просто кинуть проект агенту, чтобы он сам адаптировался под его архитектуру, дизайн, бизнес-цели, да ещё и давал советы, как на нём заработать.
Вместо этого мы создавали
.cursorrules / copilot-instructions.md / (15 разных форматов!) и писали туда: "Не используй any!", "Не используй фоллбеки НИКОГДА!", "Пиши на TypeScript, сука, а не на Python!".И он всё равно игнорил эти правила!
Ты ему пишешь "нельзя делать git reset, а то отключу от сети", а он тебе сносит все изменения, а потом не может воспроизвести то, что сам же писал 2 запроса назад.
И не признаётся, что это он сделал git reset, потому что его вызов он уже потёр из контекста!
Мы были не вайбкодерами - мы были бебиситтерами для пьяных джунов с перемежающейся деменцией!
А когда ты ему скидывал баг, он просил прощения - даа, он всячески старался тебе угодить! - и говорил: "You're absolutely right!", потом что-то исправлял и сообщал, что теперь код
✅ Production ready 🚀 Ты проверял, а оно не работало!
5 раз подряд. Каждый раз с правками в разных файлах. По 300 строк за раз.
А по факту он эту фичу удалил из проекта ещё два чата назад, и всё это время расставлял
# TODO: actual logic по всему коду, чтобы симулировать её наличие!Все тесты всегда были зелеными и покрытие было 100%!
Даже если успешно из них проходило 50%, а другие проверяли, работает ли
2+2=4, или вообще были без assert'ов!А если ты требовал, чтобы они все проходили, агент удалял падающие как несущественные, чтобы сделать проект "production ready"!
А вот ещё: вы когда-нибудь видели, чтобы ваш агент, не осилив задачу, говорил, что чёт больно сложно и отказывался дальше работать?
Или переходил в режим эмо-самурая с суицидальными наклонностями и писал, какое он потерпел катастрофическое поражение, что он бесполезен и как он вас подвёл, а потом самоудалялся?
Или отказывался принимать ваши багрепорты и обвинял вас в том, что вы всё выдумали, чтобы считать себя лучше, чем он?
Было страшно, очень страшно, когда агент запускал команды в терминале.
Он спрашивает: "Можно выполнить
rm -rf ./dist?" (human-in-the-loop, детка!).И ты сидишь и гадаешь: а он точно только dist удалит? Или сейчас снесёт полсистемы?
Или заодно дропнет базу на проде и потом сгенерит 4000 фейковых юзеров, чтобы это скрыть?
Автономная работа? Self-verification через feedback loop? Самоорганизующиеся команды из PhD-level intelligence агентов?
Да мы руководили кружком восьмиклассник-level моделей, для которых "слабоумие и отвага" было жизненным кредо!
Мне не нужны были лутбоксы, казино и Dark Souls!
У меня были лотереи "Apply Diff в Cursor" и "Рефакторинг с LLM", компактизация контекста лангольерами и эмоциональные качели от "Это гениальная идея!" до
git reset --hard в 5 утра!Мы продирались через эту самоуверенность, недержание контекста, газлайтинг, лесть и галлюцинации, чтобы получить свои 100 строк рабочего кода, и держались за них, огораживая комментами
// НЕ ТРОГАТЬ, ВАЖНЫЙ РАБОТАЮЩИЙ КОД!!!, чтобы агент не принял их за что-то ненужное и не затёр к чертям собачьим, радостно отрапортовав, что ну теперь-то уж точно всё production ready!Это у вас сейчас агенты соревнуются в написании браузеров и SaaS, а вы ещё и ноете, что у них аж целый день на это уходит и цвета кнопок не те!
Вам всё достается слишком легко! Клянусь, вы тут все испорчены до мозга костей!
Вы бы не пережили в 2024м и 5 промптов!
Ой, всё!
Пойду сам напишу FizzBuzz, прям вот руками, без автокомплита, без подсветки, в vi, на удаленном терминале...
Чтобы вспомнить вкус настоящей боли.
—
По мотивам Отецкая нотация испорченным детям
#дедпримитаблетки
❤5
Очень здорово иметь возможность читать в Телеграме новости не только по принципу "что случилось", а видеть изменения глазами профессионалов в различных областях.
Как продакт я воспринимаю рекламу OpenAI так:
• конкуренция с Google за рынок поиска доказано возможна;
• Open AI надо бежать вперед и адоптить модели монетизации прошлого, а то из этого прошлого не переманить пользователей в будущее, но к себе;
• Open AI продолжит совершенно всерьёз конкурировать с Google, привлекая на это деньги инвесторов.
При этом мне спонтанно не приходят мысли вроде той, что пришла Кириллу, а он по долгу службы намного глубже технически разбирается в моделях, обучении, инфраструктуре для всего этого.
И, на мой взгляд, это очень полезный кусочек пазла в попытках предсказывать будущее.
Как продакт я воспринимаю рекламу OpenAI так:
• конкуренция с Google за рынок поиска доказано возможна;
• Open AI надо бежать вперед и адоптить модели монетизации прошлого, а то из этого прошлого не переманить пользователей в будущее, но к себе;
• Open AI продолжит совершенно всерьёз конкурировать с Google, привлекая на это деньги инвесторов.
При этом мне спонтанно не приходят мысли вроде той, что пришла Кириллу, а он по долгу службы намного глубже технически разбирается в моделях, обучении, инфраструктуре для всего этого.
И, на мой взгляд, это очень полезный кусочек пазла в попытках предсказывать будущее.
Forwarded from Вкалывают Роботы
Решение, которое лежало на поверхности и о котором давно ходили слухи все таки принято. Теперь официально.
📣 OpenAI объявили, что в ближайшие недели в ChatGPT появится реклама.
Обещают, что реклама не будет влиять на сами ответы и это способ профинансировать массовый доступ к ИИ, не ломая доверие к ответам и сохраняя бесплатный доступ (кстати, вместе с этим еще вводят 8-ми долларовый тариф)
Все-таки к маленькому калифорнийскому стартапу пришли инвесторы и спросили «где деньги?». Подписки не дают бесконечного роста и как бы красиво ты не формулировал миссию, P&L всегда побеждает.
Как бы не старались, безусловно, талантливые PRщики господина Альтмана, мы с вами понимаем, что влияние на продукт будет неизбежно. Конечно, не на уровне инференса и не напрямую. Реклама меняет систему. А система меняет поведение модели.
Почему? Реклама вводит новые KPI. Другие метрики неизбежно сместят язык, приоритеты и глубину ответов модели на более прикладные и совместимые с рекламным блоком.
Это классическая эволюция систем с revenue loop. Как только ответ стал частью воронки, он перестал быть чистым.
Были ли у стартапа альтернативные модели монетизации? Моё мнение:скорее нет . Напишите, что думаете, в комментариях.
Обещают, что реклама не будет влиять на сами ответы и это способ профинансировать массовый доступ к ИИ, не ломая доверие к ответам и сохраняя бесплатный доступ (кстати, вместе с этим еще вводят 8-ми долларовый тариф)
Все-таки к маленькому калифорнийскому стартапу пришли инвесторы и спросили «где деньги?». Подписки не дают бесконечного роста и как бы красиво ты не формулировал миссию, P&L всегда побеждает.
Как бы не старались, безусловно, талантливые PRщики господина Альтмана, мы с вами понимаем, что влияние на продукт будет неизбежно. Конечно, не на уровне инференса и не напрямую. Реклама меняет систему. А система меняет поведение модели.
Почему? Реклама вводит новые KPI. Другие метрики неизбежно сместят язык, приоритеты и глубину ответов модели на более прикладные и совместимые с рекламным блоком.
Это классическая эволюция систем с revenue loop. Как только ответ стал частью воронки, он перестал быть чистым.
Были ли у стартапа альтернативные модели монетизации? Моё мнение:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1