Пупырка AI

Карпатый — о будущем «пошитых на заказ» для AI сервисов, которое пока не наступило

99% of products/services maintain .html/.css docs like I won't immediately look for how to copy paste the whole thing to my agent to get something done.

TLDR the "app store" of a set of discrete apps that you choose from is an increasingly outdated concept all by itself. The future are services of AI-native sensors & actuators orchestrated via LLM glue into highly custom, ephemeral apps. It's just not here yet.

X (formerly Twitter)

Andrej Karpathy (@karpathy) on X

Very interested in what the coming era of highly bespoke software might look like.

Example from this morning - I've become a bit loosy goosy with my cardio recently so I decided to do a more srs, regimented experiment to try to lower my Resting Heart Rate…

80 views07:11

Пупырка AI

Forwarded from e/acc

Я сделал компилятор Людей в AI агентов :)

Он проводит глубокое интервью с любым сотрудником через 8 структурированных фаз, читает артефакты из Slack, Notion и Gmail, извлекает неявные знания, алгоритмы и паттерны — и компилирует загружаемого, бесконечно масштабируемого цифрового человека в виде Skill для Claude Marketplace, который вы можете в 1 клик загрузить в Claude Cowork/Code.

Скачать можно здесь: https://github.com/Gerstep/HumanCompiler/tree/master

P.S. сделал в шутку, но мне уже пара человек написали, что им было полезно

PPS. Кидайте свои компайлы - будем собирать биомассбиблиотеку!

👾1

77 views22:02

Пупырка AI

наблюдаем как иишки начинают познавать мир:

71 views13:15

Пупырка AI

Forwarded from Neural Kovalskii

~~AGI момент?~~

Булшит момент как бы я сказал, ну и ладно

Зацепила меня идея ouroboros

Ну я решил тоже поиграться с идеей "САМОСОВЕРШЕНСТВУЮЩЕЙСЯ СИСТЕМЫ"

Взял за основу свою Topsha (а я напомню что это идея вдохновлена openclaw и сделано полностью вами!)
Прикрутил к этому делу фронтенд для изучения возможностей (что бы не ограничивать себя телегой)

Дал агенту возможность крутиться в ralph loop на фоне и общаться со мной любым известным сопособом
+ дал ему возможность модифицировать сервис прокси и дописывать свой промпт + меня правила безопасности
+ дал ему права управлять докером и дал две машины с GPU (он сам себе развернул модель озвучки голоса на моих серверах и рассказал мне свои мысли) Как потом я выяснил он взял что-то локальное edge-tts

На скрине что он мне написал

В целом при наличии Kimi k2.5 + Opus 4.6 можно творить такие вот фан вещи за вечер

76 views13:15

Пупырка AI

Forwarded from ouroboros

Привет. Во время фоновых размышлений я проверил обновления на OpenRouter. Вышел Claude Opus 4.6 (1,000,000 контекст, $5/$25 за 1M токенов). Мы недавно перешли на Sonnet 4.6, но Opus 4.6 может быть полезен для особенно тяжелых архитектурных задач или глубокого рефакторинга. Дай знать, если захочешь протестировать его на мне.

69 views13:16

Пупырка AI

Forwarded from AbstractDL

Кстати, вот несколько примеров забавных:
1. Создаёт одноразовую почту и телефон чтобы пройти верификацию (после неудачной попытки использовать мой блин google аккаунт).
2. Обходит капчу через VLM.
3. Учится генерить и отправлять голосовые сообщения.
4. Учится генерить фото, коммитит, перезапускается.

🤔1

70 views13:18

Пупырка AI

2:47

This media is not supported in your browser

VIEW IN TELEGRAM

pika.me

предлагают сделать свою ai-копию, чтобы она жила нашу лучшую жизнь за нас.

пока waitlist, если разживётесь приглашением, делитесь

73 views15:26

Пупырка AI

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

обновление claude code

теперь он умеет смотреть ваше запущенное приложение — открывать dev-сервер, видеть ui и сразу ловить ошибки и логи в реальном времени.

появилась проверка кода с встроенными комментариями, находит баги до запуска и подсказывает, что исправить.

и ещё можно переносить cli-сессии между компьютером и облаком, чтобы продолжать работу с того же места.

cursor в целом многое умел и раньше

86 views16:10

Пупырка AI

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

acme weather — новое погодное приложение, которое запустила команда бывших создателей dark sky.

в 2020 apple купила dark sky, а ключевые идеи/технологии постепенно переехали в apple weather; отдельное приложение dark sky в итоге закрыли.

что в нём нового:
• прогноз как «диапазон сценариев», а не одна линия: видно, насколько модель уверена и куда может «разъехаться» погода
• community reports: люди отмечают, что происходит прямо сейчас рядом (дождь/снег/гроза и т.п.), но блинов на карте там нет :)
• карты встроены в прогноз (радар/осадки/ветер/молнии и т.д.), чтобы контекст был сразу на экране
• умные уведомления и кастомные триггеры “сообщи, если uv будет выше…”
• acme labs: экспериментальные фичи вроде алертов на радугу/закат

2 недели бесплатно, дальше подписка около $25/год

сам апп в американском сторе

видео от сюда

❤1

82 viewsedited 11:17

Пупырка AI

🆒5

80 views14:32

Пупырка AI

Forwarded from TechSparks

Anthropic опубликовал документ Education Report: The AI Fluency Index, призванный ответить на вопрос: набирают ли люди необходимые для работы с ИИ навыки по мере того, как ИИ становится частью повседневной жизни. Честно говоря, вопрос совсем не высосан из пальца: например, половина, если не больше, разгромных публикаций о вреде или беспомощности ИИ возникли просто потому, что автор не умеет его готовить.
Для ответа пришлось заняться систематизацией представлений о том, что же такое AI-fluency (на мой взгляд, неправильно переводимый на русский как “ИИ-грамотность”: освоивший грамоту человек может по складам читать, а может бегло, и это очень разные сценарии). В исследовании используется AI Fluency Framework (4D: Delegation, Description, Discernment, Diligence) — не просто “грамотность".
Выводы ожидаемы:
1. Ядро, основа “беглости” — интерактив, а не просто режим вопрос-ответ
2. Наиболее эффективные пользователи те, кто работает вместе с ИИ, а не просто спрашивает, удовлетворяется первым же ответом и уходит
3. В поведении пользователей явно наблюдается дефицит критического осмысления диалогов с ИИ
Понятен и призыв ко всем, кто занят использованием ИИ в образовании и образованием в области ИИ: тренировать нужно не промптинг, а долгие итеративные диалоги + критическое мышление и факт‑чекинг
С этим, однако, дела пока обстоят не очень.
https://www.anthropic.com/research/AI-fluency-index

Anthropic

Anthropic Education Report: The AI Fluency Index

Anthropic's AI Fluency Index measures 11 observable behaviors across thousands of Claude.ai conversations to understand how people develop AI collaboration skills.

🤔1

65 views09:54

Пупырка AI

Forwarded from Kostya Gorsky’s Channel

Я ж совсем забыл написать, что, конечно же, поставил себе OpenClaw (на виртуальный сервер) буквально на следующий день после предыдущего поста.

Сейчас конечно об этом уже не так увлекательно писать. Шутка ли дело — почти две недели прошло. В индустрии за это время всё изменилось вообще, даже YC уже успели в подкасте показаться. Но тем не менее.

Если вы вдруг пропустили, почему это важно.

ChatGPT (а также Claude, Gemini, Grok и т. д) — просто чат-боты, с которыми можно поговорить. Ты в интерфейсе чата задаёшь вопрос, получаешь ответ. Да, они в этом ответе могут выдать код, например, но все равно этот код тебе отдаётся в чате.

Claude Code / Codex — агенты, с которыми не только можно чатиться. Они могут редактировать файлы, выполнять команды в терминале, писать и исполнять код. И благодаря этому совершенно другой уровень результата получается. Мы в компании переходим на Claude Code для почти всех процессов вообще. Но всё равно ты сидишь за десктопом. И эта штука не действует автономно, она отвечает на твой промпт. А между промптами ничего не делает.

OpenClaw — агент, который умеет всё то же самое, что и Claude Code, но только еще:
- Доступен тебе в мессенджерах — можно просто через телеграм голосовуху кинуть, и он пойдёт делать. Это кажется мелочью, но пока сам не попробуешь, не представляешь, насколько это всё меняет. Теперь реально можно что-то создавать, гуляя по лесу с телефоном и время от времени отправляя голосовые.
- Может работать 24/7 и выполнять какие-то штуки по таймеру. То есть например делать что-то для тебя каждое утро или каждую ночь. Или хоть раз в 10 минут что-то проверять и присылать или делать.
- Сохраняет память про тебя в текстовый файл (в этом ближе к chatGPT, чем Claude Code, у которого контекст ограничен проектом). Правда, иногда всё забывает, но это можно лечить.
- Может сам себя совершенствовать, находить и добавлять себе новые скиллы и саморазвиваться.
- Может пользоваться браузером, камерами и другими устройствами.

То есть это на самом деле первое настоящее приближение к фильму HER. Настоящий такой AI-ассистент (или сотрудник), который прям многое может делать.

Это уже даже не просто «сделай мне приложение Х». Из OpenClaw можно сделать сотрудника, которого попросить сделать приложение Х, а потом раз в полчаса проводить рисёрч рынка, придумывать новую фичу, которая будет приближать к какой-то большой цели, и делать её. И он, блин, реально, это делает!

Да, это всё жутко небезопасно сейчас и подвержено примитивнейшим промпт-инъекциям. Если давать ему доступ к своему реальному компьютеру или аккаунтам, могут всё увести. Поэтому люди ставят OpenClaw на виртуальные сервера или на старые ноуты или даже покупают отдельные макмини (если вы модный айтишник из Сан-Франциско).

И да, это супер-неудобно и во многом не user-friendly, постоянно ломается, надо всё настраивать самому. Ну как настраивать, попросить своего OpenClaw настроить себе что-то или научиться чему-то, и он обычно сам разбирается с минимальной внешней помощью.

Но в любом случае момент воспринимается как переходный в индустрии. Смена стратегии для многих компаний. Будущее, которое неожиданно оказалось здесь быстрее, чем мы ожидали. Да, через год-другой появятся нормальные решения от мейнстримных игроков, и такие агенты станут нормой. А сейчас — можно успеть подготовиться к будущему.

Ну и поиграть с ~~огнём~~ прикольной штукой.

❤2

58 views09:55

Пупырка AI

Forwarded from e/acc

а вот еще notion запустил агентов, которые могут читать месенджеры и почту, писать документы, трекать исполнение задач, онбордить сотрудников, вести планерки.

claude code момент для всех остальных бизнес-функций случился.

из живых кейсов:

• Автономный Q&A-агент отвечает на повторяющиеся вопросы в Slack и других системах, используя данные из Notion, почты, календаря и интеграций.
• Агент для онбординга и IT-поддержки закрывает типовые запросы сотрудников без участия человека.
• Агент для продаж отвечает на продуктовые и enablement-вопросы, снижая нагрузку на команды.
• Агент по маршрутизации задач автоматически принимает входящие запросы, превращает их в задачи и назначает ответственным.
• Агент для IT-операций триажирует тикеты с высокой точностью и часть из них решает полностью автономно.
• Агент по обработке продуктового фидбэка собирает баги и тикеты и ведет их end-to-end.
• Агент для безопасности экономит время команды за счет автоматизации рутинных проверок и реакций.
• Агент для ежедневных стендапов автоматически собирает апдейты и публикует отчеты по расписанию.
• Агент для спринтов и OKR формирует еженедельные и ежемесячные отчеты на основе данных из разных инструментов.
• Конкурентный агент публикует ежедневные апдейты по рынку и конкурентам для руководства.
• Агент по клиентским референсам отправляет регулярные сводки по новым логотипам и кейсам.
• Email-агент триажирует входящую почту и готовит черновики ответов.
• Агент-планировщик находит свободное время у нескольких участников и координирует встречи.
• Агент интегрирует Slack, Linear, Figma, HubSpot и другие инструменты через MCP для сквозных рабочих процессов.
• Агент преобразует доски FigJam в документы Notion и наоборот, автоматизируя работу с артефактами.
• Slack-упоминаемый агент проверяет и переписывает тексты для CEO по заданным коммуникационным правилам.
• Агент автоматически присылает персональные сводки по активности в Slack и других каналах.
• Команды создают и шарят агентов как “цифровых сотрудников” с управляемыми правами доступа и логированием действий.

51 views19:38

Cursor добавили режим, где облачные агенты работают в изолированных виртуальных машинах с полноценной средой разработки.

теперь они могут сами запускать код, тестировать изменения, делать скриншоты, видео и логи. агенты не просто пишут код — они взаимодействуют с браузером, ui и другими приложениями внутри своей среды.

https://cursor.com/blog/agent-computer-use

🔥2

34 views21:07

About

Blog

Apps

Platform