Трагедия общин 🤌
669 subscribers
53 photos
1 video
44 links
Пишу про разные штуки вокруг технологий
Download Telegram
Как так? Чуваки из Cursor на интервью говорят, что это из за неповоротливости Microsoft.

Майкл: Следующий большой скачок произошёл, когда в конце 2022 года мы получили ранний доступ к GPT-4. Возможности модели сделали гигантский прыжок вперёд.

Программирование кардинально меняется. Всё будет проходить через эти модели. И для этого нужна совершенно новая среда разработки - и тогда мы решили создать Cursor.

Лекс: Это форк VS Code - редактора, который любят почти все разработчики. Но почему не сделать просто расширение?

Майкл: Модели будут только улучшаться и менять подход к разработке софта. Нам не хотелось ограничиваться возможностями плагинов. Форк VS Code дал нам полную свободу создавать то, что действительно будет полезным.

Лекс: Но ведь в VS Code уже есть Copilot. Cursor получается прямой конкурент?

Аман: Это уникальная ситуация. Обычно новая технология порождает одно новое поколение инструментов. Но здесь каждая новая модель открывает совершенно новые возможности. Если ты опережаешь конкурентов хотя бы на несколько месяцев - твой продукт становится намного полезнее. Наша цель - сделать так, чтобы Cursor через год заставил сегодняшний Cursor казаться устаревшим. Microsoft проделала отличную работу, но большая корпорация просто не может двигаться так быстро, как стартап.

Лекс: То есть дело в скорости и частых итерациях?

Аман: И в готовности экспериментировать.

Суалех: Я думаю не просто о фичах, а именно о новых возможностях. Каждая новая модель - это более длинный контекст, более быстрый вывод, новые идеи. Некоторые звучат дико, но парочка точно выстрелит. И мы хотим быстрее доставлять их пользователям.

Когда мы только начинали Cursor, чувствовали разочарование. Модели развивались, а Copilot - нет. Никаких новых фич, не с чем экспериментировать. Всё застыло на месте.

Лекс: Да, Copilot начал быстро казаться устаревшим.

Арвид: Наше главное преимущество - всё делается в одном месте: UX, промпты, поиск, обучение моделей. Одни и те же люди работают над всем продуктом.

Суалех: Человек, который проектирует интерфейс, и человек, который обучает модель, могут сидеть в нескольких метрах друг от друга или вообще быть одним человеком.

Суалех: Такой подход позволяет делать вещи, которые сложно реализовать по-другому.


А как это выглядело со стороны Microsoft?

Они наконец нашли способ вновь побороться за когда то проиграные рынки. Наделла видел в GPT-4 не просто ассистента для написания кода, а возможность запихнуть копайлот в поиск, в браузер, в офисные приложения.

Я испытываю огромное уважение к Google и к тому, чего они достигли. Это невероятная компания с потрясающими людьми, и я очень уважаю Сундара и его команду. Я просто хочу, чтобы мы не стояли на месте и продолжали придумывать новые крутые штуки. Сегодня мы добавили немного конкуренции в поисковую индустрию - и поверьте, я ждал этого целых 20 лет.

Но давайте будем честными: Google это 400-килограммовая горилла на рынке поиска. Надеюсь, что благодаря нашим инновациям они обязательно захотят выйти и показать, что горилла все еще умеет танцевать. И для меня будет огромной победой, если люди заметят, что именно мы заставили Google танцевать.


То есть успеха Copilot у одних программистов мало. Ощущение магии, первый киллер-апп у нейросетей.. это всё меркнет по сравнению с шансом откусить кусок от поисковой монополии.
👍6
Ну и ничего не вышло.

В Bing добавили Sydney - бота на основе GPT-4 с доступом к инернету. Он понимает контекст и твои намерения без четких ключевых слов. Можно уточнять запрос в том же разговоре, а не искать каждый раз заново. Sydney показал, что поиск может быть намного удобнее.

Но всплыла огромная проблема - он патологический лжец. В одном из тестов он дал неверную информацию в 7 из 15 запросов по новостям. То есть, доверять результатам было вообще нельзя, а для поискового сервиса это критически важный недостаток.

Как так то?

Основная теория в том, что Sydney был ранней версией GPT-4, поспешно доработанной на старых данных и не прошедшей полноценный файнтюнинг как ChatGPT. Это система, которую наспех выпустили, чтобы догнать Google.

Дальше Microsoft начали лепить бренд "Copilot" на всё подряд. Появилось куча конкурирующих между собой AI-ассистентов. И никто не отвечал за конечный результат. С 2023 в компании было 3 больших реорганизации и полный раздрай внутри команд.

Не похоже, что они кого то заставили танцевать.

Зато отлично получилось отжать рынок у Slack, используя доминантное положение экосистемы. Они добавили Teams в бандл, фактически сделав приложение бесплатным и насильно установив его своим юзерам.

Конкурировать против такого сложновато. Антимонопольное дело длилось несколько лет и как будто сильно запоздало.

Пару лет назад я был в восторге от инвестиций Microsoft в OpenAI и их планов подорвать Google. Это новый Microsoft с новой культурой и жаждой строить классное будущее для своих юзеров.

Но их откровенно нечестная конкуренция никуда не делась, а единственный свой действительно крутой и прорывной продукт они потеряли за несколько лет хаоса среди менеджмента.
👍52
* Рост аудитории Teams vs Slack
* Два твита Андрея Карпати, где он полностью переобувается
👍3
7 - Amazon

Эти совсем охуели. Amazon прогибают на рынке вообще всех: покупателей, продавцов и другие маркетплейсы.

Два года назад на Amazon подали в суд власти 17 штатов за системное подавление конкуренции. Якобы они используют грязные приемы, не давая соперникам даже минимального шанса на успех.

Что за приёмы?

1. Продавцы фактически не могут предлагать свои товары дешевле на других платформах. Алгоритмы просто закапывают такие товары вниз поисковой выдачи и их почти никто не видит.

2. Продавцов лочат на платформе. Им навязывается дорогой сервис доставки, чтобы получить Prime статус. Без него конкурировать не реально. Но взамен тебе приходится хранить свои запасы на складе Amazon. И если ты хочешь разместиться параллельно на другой платформе - нужно поддерживать отдельный запас, что сложно.

3. Amazon перенаправляет внимание юзеров на агрессивную рекламу в самых заметных местах результатов поиска. Причем эти товары оказываются дороже и хуже соответствуют запросам. Для продавцов это фактически дополнительный налог на видимость.

Короче, покупатели получают результаты поиска забитые рекламой. Продавцов вынуждают платить гигантские комиссии, чтобы иметь возможность торговать. Их расходы перекладываются в увеличение цены, в том числе и на других площадках. Что в свою очередь мешает уже конкурентам самого Amazon.

Но это не всё.

Amazon пошли дальше и прогибают еще и своих сотрудников.

В 2021 году фильм Nomadland лутанул несколько Оскаров. Там в одном из эпизодов показали как главная героиня работает на сезонном складе Amazon.

В целом ничего такого, просто скучная физическая работа.

Хотя в книге автор серьезно критикует суровые условия труда на складах. Это нестабильная и тяжёлая работа, выбираемая больше из отчаяния. А не ради свободы кочевника как в фильме.

Исходный материал - это документальная книга про реальных людей. И они там оч жестко отзываются про сезонную работу. В реальности Amazon следит за своими сотрудниками - в доставочных фургонах стоят камеры, на складах камеры, на работниках-упаковщиках камеры. Ну вы поняли, короче.

От людей требуется быть винтиками в оптимизированных цепочках производства. У тебя на всё есть таймеры. Работаешь как машина, где твои перерывы на еду, туалет и отдых тоже часть процесса.

Жесткий контроль, чтобы выжать как можно больше производительности. Еще и платить меньше стали.
👍62
* Картинка из статьи
👍2
8 - И чо?

Этот пост начался с интервью Марка Андриссена, который топит за новую технологическую волну. По его мнению, нас ждёт эпоха новых компаний в которой нынешние гиганты потеряют актуальность.

Я поймал себя на том, что мне хочется верить в такой сценарий, хотя до конца не понимал, почему именно. Наверное, потому что последние пять лет жопа горит от большого интернета.

Ок, а есть ли реальный шанс на позитивные изменения?

После примеров выше, надежды на антимонопольные регуляторы и правительства у меня нет. И на то, что крупные корпорации вдруг искренне одумаются и изменятся, рассчитывать тоже наивно.

Чтобы починить то, что сломано, нужны новые условия новой экономики.

Поэтому хочу копнуть глубже и понять две вещи:

1. На чём держится старая экономика и доминирование Бигтеха?
2. Как именно развитие нейросетей поменяет условия?
🔥135❤‍🔥3
Про Клауд Код

Я перестал смотреть на бенчмарки.

Топовые модели стали настолько похожи, что уже не важно, какая из них лучше решает задачки. Важно у кого продукт лучше.

Последние недели активно вкатываюсь в Claude Code. И в каком же я восторге! Я не помню когда последний раз я с таким кайфом изучал что-то новое. И я в этом не одинок, "люди в интернете" как будто заражаются этим как вирусом.

Хочу порасcуждать, почему так и мб заразить и вас =)

0. Время и человеческая лень.

Как думаете, как давно появился термин вайб кодинг? Можно прям конкретную дату найти, потому что он разошёлся после одного твита Андрея Карпати.

3 февраля 2025.

Неожиданно, да? Меньше года, а кажется что вайбкодеры были с нами уже вечность


Ещё интересно, что Claude Code раскатили на всех аж далёкой весной 2025. И за это время Антропики проделали невероятную продуктовую работу.

Почему я так восхищён?

Клауд - это продукт, который бьёт во что то древнее, что было с человечеством всегда. Мы все ленивые жопы. Кто то в большей степени, кто то в меньшей. И мы обожаем когда машины делают за нас работу.

Клауд каким то незаметным образом воззвал к моей ленивости. И сделал так, что я целыми днями изучаю видосики и учусь автоматизировать свою рутину.

Он атаковал мою лень и победил.
🔥101
1. Крутые продукты создавать непросто.

При создании продуктов, считается базой прикинуть основные риски и как можно быстрее их проверить. Выложить первую версию дающую юзеру ценность и потом потихоньку улучшать и править косяки.

Но это сложно.

Сложно сходу угадать в какой форме лучше всего доставить ценность и ценность ли это вообще и для кого. Короче, много предположений. И еще сложнее потом следовать намеченному плану и методично эти предположения проверять и строить продукт на основе того, что сработало.

Например, чуваки из OpenAI как мне кажется не справляются. Они понавыпускали кучу прикольно звучащих фичей (Canvas, Memory, Apps, напоминалки, интеграция с файлами) но... с каждой что то фундаментально не так. В итоге весь продуктовый обвес вокруг классной модели это набор наскоро выпущеных и потом забытых фичей.

Обидно за них, потому что я думаю, что "продуктовый обвес" не менее важен чем сама модель. Я почти перестал смотреть на бенчмарки. Топовые модели почти одинаковые, AI лабы отлично справляются с технической стороной вопроса. Но бенчмарки не показывают, что такого нового в своей жизни ты сможешь делать, если перйдёшь с одной модели на другую.
🔥6👍2
2. И что такого нового теперь можно делать?

В старом посте про интерфейсы я говорил, что они неэффективны по сравнению с тем, что хочется.

Экономический рост ближайшего будущего вроде как будет про то, что мы автоматизируем всё больше и больше когнитивных задач. Но машины пока не настолько хороши, чтобы понимать нас с полу-слова. И нам явно не хватает пропускной способности наших интерфейсов чтобы с этим справиться.

> Компы, интернет и мобилки ускорили то как мы учимся и обмениваемся знаниями. Мы все больше полагаемся на цифровой мир как на свой инструмент. Мы почти киборги - меч самурая (клавиатура) уже настолько завязан с нейронами в мозгу, что это почти продолжение нас самих.

> Но наши интерфейсы взаимодействия с цифровым миром не то чтобы супер эффективные. Все еще используем тот же язык, что и тысячи лет до нашей эры. И с помощью этого языка, глаз и десяти кожаных колбасок пытаемся взаимодействовать с информацией. Это медленно.

Мы ленимся писать длинные промпты, ленимся добавлять нейронке примеры, ленимся изучать баш команды или как через пару строк на питоне подключиться к API. Большинство людей всё делает руками, как до промышленной революции крестьяне копали лопатой, а не трактором.
🔥71
3. Клауд код это уверенный шаг в нужном направлении.

Не хочется дальше сильно проваливаться в метафоры, но клауд код это трактор / комбайн / механический завод / налаженный процесс производства. Только для цифрового мира.

Пока OpenAI методично выпускают модели и собирают бабки, чтобы генерить людям картинки в стиле Studio Ghibli, Антропики так же методично улучшали продуктовый обвес.

Меньше чем за год они добавили поддержку MCP, доступ к файлам и VSCode, плагины, управление браузером, запуск агентов в бэкграунде. Внезапно оказалось, что модели последнего поколения уже достаточно умные и им не хватало только продуктового обвеса. Что всё это может работать вместе, не разваливаться и давать результат.

Это далеко не идеальный инструмент, галлюцинации никуда не делись. Он переусложняет и выбирает странные подходы. Он все еще может выдавать чушь и при этом строить уверенное лицо. Но всё это теперь можно обходить. Выдаёт не тот результаты и обманывает? На этапе планирования пишешь чеклист самопроверки, запускаешь 10 раз в фоне. И 1 из 10 будет тем что тебе нужно.

Тут нет ничего нового, это можно было делать и до клауд кода. Но я ленился. Копировать бесконечные промпты из заметок, открывать кучу окон в браузере, вычитывать это всё потом. Я думаю вы тоже ленились.

Но в новой парадигме ты это больше не глаза и 10 колбасок. Ты это архитектор, делегирующий низкоуровневые задачи машине. И у нее есть доступ к контексту через файлы на твоем компе, к сервисам в интернете через MCP, к возможности делать дела через агентов с доступом к консоли.

Это непередаваемое чувство, когда ты видишь как модель в консоли перебирает одно не работающее решение за другим. И в какой то момент у нее получается. Она проверяет, что результат тот что нужен, ставит галочку в плане и идёт дальше.

Это пиздец. Я заразился будущим.
🔥15👍31
В чем фишка рассуждающих моделей

Это старый пост, который я написал год назад и почему то не опубликовал. Все еще актуальный, хотя ощущается как будто из прошлой жизни.

Я вдохновился постом от чуваков из Latent Space подкаста о том как писать промпты для о1.

Не люблю возню с промптами, особенно чужими. По моим ощущениям в том чтобы нейронка выдала приемлимый результат есть много случайности, субьективности и мелких деталей важных для отдельной задачи.

К сожалению модели не могут читать твои мысли, поэтому промпты писать все таки нужно. Просто копировать чужие - не очень хорошая идея.

1.
о1 это не чат, это генератор отчетов.

Есть два принципиально разных подхорда.

Первый - это стандартная работа с моделью в чате. Накидываешь промпт и потом итеративно поправляешь модель и дополняешь свои требования, пока не получишь на выходе что то приемлимое.

По вайбу это похоже на гончарное дело. Модель изначально не идеально понимает что ты от нее хочешь и с помощью обратной связи постепенно извлекает из тебя контекст.

Второй подход - принципиально другой. Новые модели, которые умеют рассуждать (о1, о3, DeepSeek) воспринимают твой первый запрос как окончательную инструкцию к действию и не пытаются выудить из тебя контекст.

Поэтому нужно запихивать его самому.

Про такие модели полезно думать не как о чатовых, а как о генераторах репортов. Если ты сразу дашь ей достаточно контекста и опишешь что хочешь на выходе - она часто сможет выдать адекватное решение с первого раза.

2.
Не пиши промпт - пиши бриф.

Представь, что о1 это новый сотрудник на работе. Чтобы он справился с задачей его нужно погрузить в контекст. Чем полнее, тем лучше.

Если это кодинг - нужно скинуть всю репу, описать чем занимается компания, зачем юзерам этот продукт итд.

Тут отлично помогает голосовой режим. Создаешь отдельный чат в 4о и голосом наговариваешь всё, что тебе кажется релевантным. Потом можно попросить сделать саммари и закинуть его в бриф как контекст. Или вообще без саммари полностью скопипастить чат.

Еще это косвенно помогает тебе самому лучше понять чего ты хочешь.

3.
Опиши конечный результат, а не то как его достигать.

Для чатовых моделей работает история где ты просишь ее принять роль (ты опытный журналист, программист итп) и добавляешь советы типа думай шаг за шагом.

Рассуждающей модели это только мешает взять на себя ответственность за результат, запланировать собственные шаги решения и реализовать их. Даже если модель не идеально умеет думать в автономном режиме - со временем они научатся делать это лучше.

Эксперты не любят чайка-менеджмент. Что делать вместо этого?

Потратить усилия, чтобы лучше разобраться в задаче. Описать критерии хорошего и плохого результата. Тогда у модели будет способ самой оценить результат и поправить ошибки.

Есть еще ультимативный вариант, когда нужен крутой результат для повторяющейся задачи. Делаешь один раз сам, просишь модель сделать свою версию и потом сравниваешь что получилось. Нейронка может проанализировать свои ошибки и записать выводы. Еще лучше если у тебя уже собрано куча примеров хорошего и плохого результата как принято делать в продакшн приложениях.

4.
Понимать в чем думающие модели лучше.

Это one-shot задачи типа проанализировать кучу файлов, обьяснить сложную концепцию, поставить медицинский диагноз или решить задачку по математике.

Считается что такие модели меньше галлюцинируют. Но пока им нужно помогать и давать способы проверять себя.

Они не всегда хорошо понимают насколько много нужно думать над задачей и могут уходить в бесконечные размазывания соплей по кругу, когда уже давно нужно было дать финальный ответ. Поэтому в бриф стоит добавить секцию с ограничениями. И секцию где ты описываешь формат на выходе.
👍84🔥1
5.
Короче:

- Формулируешь конечный результат
- Описываешь в каком формате
- Описываешь ограничения
- Закидываешь в конец кучу контекста по задаче

Весь 2025 я прилежно старался использовать эти советы и могу сказать, что они работают. Они были логичным ответом на появление моделей думающих перед ответом по 5+ минут. Разговаривать с ними не удобно, а вместо этого их нужно пичкать контекстом и давать свободу в выборе способа решить задачу.

Спустя год, пора двигаться ещё дальше.

Агентские системы взяли лучшее от итераций в режиме чата и построения огромных промптов.
👍61🔥1
Про неявное знание

1. Посмотрел документалку про ирландского фермера, который делает ножи.

Это рассказ про мастерство и семейное наследие.

Мне зашло, что авторы подвязали сюда тему неявного знания. То есть знания, которое трудно сформулировать и передать словами.

Например, умение ездить на велосипеде. Неявное знание - это моторика, интуиция и то что мы называем опытом, мудростью или проницательностью.

А еще это умение ковать ножи.

Для мужика из видео это скорее искусство, чем ремесло. Он затачивает лезвие по ощущению. Смотрит на отблеск и чувствует сталь.

Вместо замеров у него куча странных мелочей, которым он научился за годы практики.

Например, тест готовности ножа. Он режет бумагу и оценивает заточку на слух. Он слушает звук и сравнивает его с тем, как должно быть. Любое минимальное отличие и он находит дефект.

Как он этому научился?

Очень просто. Двадцать лет делал ножи и научился.

2. Проблема неявного знания буквально написана в его определении.

Как научить другого человека крафтить такие же ножи?

Можешь ли ты словами обьяснить как должен звучать идеальный разрез? Ну как то можешь. Но этого недостаточно, чтобы ученик натренировал свой мозг распознавать нужные звуки так же хорошо как мастер. И это только один секретик из множества в его процессе.

Поэтому ученик годами учится и практикуется. Это искусство, которое почти не передаётся словами.

Я понимаю, что это романтичная мысль.

Но неявное знание - полная хуйня, когда у тебя нет 20 лет на овладение навыком.

Даже там, где всё завязано на физический навык, избыток неявного знания тормозит прогресс.

Я это хорошо чувствую в баскетболе. На тренировках я люблю наблюдать за телом. Чувствовать где заваливается корпус, как стоит стопа, почему бросок с рывком. Я много практикуюсь и учусь чувствовать мяч.

3. Стандартизация круче, чем неявное знание.

Но по меркам профессионального спортсмена я занимаюсь ерундой.

Современный баскетбол это про измерение вообще всего.

Игроки знают, какие броски они забивают лучше. Знают, откуда и с какой вероятностью. Команды понимают, как свободное пространство в конкретной зоне влияет на атаку. И в какой момент это пространство появляется.

Около десяти лет назад Warriors показали, что такой подход работает. Они доверились данным и выстроили систему вокруг выгодных бросков. И это сработало настолько сильно, что остальные были вынуждены адаптироваться. И изменился сам баскетбол.

Считать цифры скучно. Но когда нужен результат - цифры его приносят.

Я не хочу наезжать на мастера ножей. Он не ставит цель быть лучшим в мире. Но это крутой пример. Он всю жизнь улучшал качество результата и перенёс часть своего скила в мышечную память. Ее нельзя записать и проговорить.

Но большая часть его опыта это просто неописанные процессы. У него нет терминов, метрик, чеклистов и поэтому его работа кажется романтичной магией. Хотя звук бумаги это всего лишь звуковые волны. В них есть паттерн брака или нет.

Проблема в том, что он упаковал в неявное знание слишком много лишнего. И ему:

- сложно быстро перенимать опыт других ножеделов
- сложно обучать помощников
- сложно масштабировать процесс
- сложно строить цикл улучшений сделал - измерил - улучшил

В кайфовом хобби вроде баскетбола или в семейном крафтовом бизнесе это нормально. Иногда это даже главное удовольствие.

Но в других областях неявного знания лучше бояться как огня.

Новые методы измерения напрямую ведут к открытиям. Как только ты можешь что-то стабильно увидеть или посчитать, появляются новые переменные, новые классы объектов. С ними проще строить модели. А если модель работает - она превращается в прорыв.

Например, в медицине один из самых ярких прорывов последних лет это иммунотерапия. Учёные научились точнее измерять иммунную систему. И придумали способы направлять её на атаку раковых клеток.

Я вообще не пытаюсь умалять восточную медицину. Но мне кажется, чем дальше, тем быстрее будет расти эффективность инженерной и стандартизованной медицины.

Потому что неявное знание замедляет обучение.
По возможности избегайте.
15👍12🔥6
Почему неявного знания стоит избегать.

Вам знакомо ощущение, когда задачу проще самому сделать, чем поручать нейросети?

Я когда начал разбираться в агентских системах (штуки типа Claude Code), постоянно на это натыкаюсь. Всё время хочется засучить рукава и по‑старинке сделать самому.

Потому что так я уверен в качестве на выходе. Потому что можно просто взять и начать делать, а не сидеть часами и вытаскивать из себя неявное знание о контексте задачи.

Например, у меня есть табличка, где я собираю данные про свою жизнь. Насколько у меня хороший сон, сколько работаю, как дела с кукухой и всякие другие ЗОЖные штуки.

Мне всё время хочется добавить ещё метрик. Например, сколько часов я залипаю в YouTube.

Но данные полезны только если их регулярно разбирать. Табличка внезапно превратилась в хобби в котором я на улучшение продуктивности трачу больше времени, чем на саму продуктивность.

А я не хочу хобби - я хочу готовый совет типа "неделю назад у тебя поломался сон, потому что ты много смотрел YouTube".

Короче, идеальная задача, чтобы часть анализа переложить на нейронку, а не делать всё самому.

Но.

Мой процесс сделан под меня, а не под нейросеть. Я экономил время на лишних описаниях и не тратился на бюрократию. Как кто-то извне разберётся, чем у меня отличается сон на 4/5 от 5/5?

У меня это бережно упаковано в неявное знание, которое прекрасно работает когда я сам заполняю и анализирую табличку.

Ну и это боль - сидеть и выписывать чо там в этих данных есть. Потом объяснять модели на какие повторяющиеся паттерны поведения смотреть. А чтобы получить по-настоящему крутой результат, хорошо бы еще распаковать мои знания аналитика за кучу лет опыта.

Именно поэтому чаще проще самому сделать, чем делегировать.

Оказалось, похожих задач у меня полно. И в каждой я как тот мастер ножей из прошлого поста. Знаю кучу маленьких секретиков, но толком не могу научить другого.

И чем дальше, тем хуже.

Полезных знаний стало так много, что не хочется тратить время на бюрократию. Записывать, что ты изучил. Я итак не успеваю за всем что выходит. Вместо этого хочется почитать саммари и быстрее бежать пробовать на практике.

То есть растить неявное знание.

И в итоге сейчас я в каждой задаче с муками выковыриваю это неявное знание из себя обратно. Чтобы рассказать Клоду, как делать хорошо.

Оказывается нужно было учиться за двоих. За себя и за нейросеть.

Заранее думать, как всё изученное я ей объясню. Собирать для неё артефакты. И понимать, как их потом обновлять, когда устареют.

Мне кажется, в работе с нейронками мы прошли три стадии. И каждая все меньше полагается на неявное знание.
👍83
1. Когда мы просто чатились с моделью.

Я навсегда запомню моё знакомство с Midjourney.Когда то давно они были самым крутым сервисом для генерёжки картинок. И первыми распространили идею, что вообще возможно создавать что то классное, а не нейрокринж.

Я потратил целый день на чтение документации. А в итоге половина вещей просто не работала. Нейронка генерила людей с шестью пальцами и отказывалась их потом исправлять до пяти.

Забавно, что у моего друга картинки через простые промпты без занния как оно там всё устроено получались примерно того же качества, что и у меня.

Жопа горела знатно.

Мне нехватало неявных знаний, что нужно просто запустить промпт 10 раз. И 1 из них сработает. Что нужно скидывать несколько референсов. Что промпт не должен быть слишком большим, но при этом нужно прописать много деталей. Но не слишком много.

Ничего из этого в документации конечно же не было. Нужно было много раз пробовать и учиться.

Думаю, на этапе знакомства с нейросетями каждый проходит через что-то похожее.

Ты общаешься с чатиком, копируешь чужие промпты из интернета. Но результат всё равно получается не сразу и не совсем тот, что хотелось. Нельзя стать крутым просто прочитав топ 10 советов Андрея Карпати.

То что у тебя не сработало - не значит, что ты что то неправильно сделал.

Или значит. Это модель глупая или ты дал ей неподходящую задачу?

Нужна практика и куча диалогов. Это этап творческого поиска, где ты обрастаешь неявным знанием. О том, на каких твоих задачах нейронка может быть полезна. Что при ошибке нет смысла спорить, а проще запустить заново и получить нужный результат. Или не получить.

На этом этапе ты занимаешься непонятной алхимией, где результат не гарантирован. А каждый новый чат это начало почти с чистого листа. Весь опыт бережно пакуется в голову, а не в артефакты, которые можно переиспользовать.
👍42
2. Когда появились рассуждающие модели.

Помните, как мы когда-то добавляли в промпт think step by step?

Где-то год назад этот совет устарел. Как и куча других. Я недавно писал, чего такого привнесли рассуждающие модели, что их стоит выделить как отдельную эпоху.

Они стали отвечать медленнее, но подробнее. Это уже не диалог, в котором ты потихоньку направляешь модель в нужную сторону. А большой промпт с кучей контекста на входе и такой же большой отчёт на выходе.

Из-за этого я начал лучше описывать задачи и чаще доверять модели самой искать решение.

Усилий для качественного результата нужно больше. Поэтому промпты хочется где-то хранить, переиспользовать и улучшать. Чтобы каждый раз не начинать с нуля.

Так у меня появился первый серьёзный артефакт. Огромный файл с промптами и советами. Я открывал несколько вкладок с моделями и механически копировал нужный кусок.

Где-то полгода назад я заметил странное. В файле перестало появляться что-то новое.

Почему?

Обновить большой промпт это отдельная задача, которая отвлекает от основной. Его надо вдумчиво перечитать и поправить. А делать это после пары длинных ответов из трёх вкладок не хочется вообще.

Поэтому у меня появился бэклог по улучшению промптов. И технический долг по этому бэклогу =)

Возиться с промптами скучно. Гораздо интереснее прочитать саммари статьи, чем чинить промпт, который это саммари сделал. И чем промпт больше, тем больнее вносить правки.

Короче, появились артефакты. Их можно переиспользовать. Но следить за ними лень.

В итоге проклятое неявное знание не исчезло. Оно теперь висит в бэклоге и ждёт когда ты его перенесёшь из головы в артефакт. Чем больше знаешь, тем сложнее учиться новому.
👍41💯1
3. Когда модели дали доступ к компьютеру.

Ну дали и дали, что поменялось то?

Теперь модель умеет не только отвечать, но и что то делать. Читать файлы, запускать команды и сохранять результат работы. Это уверенный шаг в сторону от неявного знания в голове к стандартизации и инженерному подходу.

Из-за того что у Claude Code есть доступ к файловой системе, стало легче просить его обращаться к документам. У меня это теперь не один огромный файл с промптами, а база скилов и контекста для модели. Их и просто использовать и просто обновлять. Потому что при каждой ошибке можно в конце просить агента улучшать скилл, чтобы в следующий раз он справился лучше.

Это движок, который дает накопительный эффект. Чем больше всего я пакую в стандартизованный процесс, тем проще в следующий раз делегировать задачу.

Моя роль теперь - направлять модель и чекать, что движок не развалился.

Я все еще много чего делаю сам и коплю неявное знание в голове. Но параллельно с этим я создаю артефакты и процессы для нейронки, чтобы она тоже училась вместе со мной.

Короче, неявное знание обновлять сложно. Самому вычитывать артефакты тоже. А вот попросить модель обновить записанные инструкции - легко.

Это движок, который становится лучше, чем дольше ты им пользуешься.
👍4🔥3
4. Выводы

Обучение это больше не про то, умеешь ли ты делать сам.

Это про то, умеешь ли ты делегировать задачу ллм, чтобы она сделала ее в нужном качестве.

Для этого нужен другой подход к обучению. Учиться самому и выстраивать внешний движок с обратной связью:

- Копить фреймворки "как делать правильно, как неправильно".
- Хранить контекст в файлах, а не в переписке с моделью.
- Ставить задачи так, чтобы модель сама решала как заюзать фреймворки и контекст, чтобы прийти к результату который ты от нее хочешь.
- Использовать агентов, чтобы проверять качество результата.
- Учитывать обратную связь, чтобы фреймворки, промпты, контекст, чек-листы обновлялись и становились лучше.

Так почему же неявного знания стоит избегать?

Потому что оно медленное и неповоротливое.
Знания в голове быстро устаревают. Но продолжают копиться.
Чем их больше, тем сложнее их обновлять.
Если неактуальных знаний слишком много - становится сложно делегировать.

А с тем как сейчас развиваются технологии это важно.
👍102