Пупырка AI

смотрим интерфейс perplexity health. доступно платным подписчикам в us

testingcatalog

❤4

292 views12:21

composer 2 cursor обновляет свою модель composer с версии 1.5 до версии 2. по заявлению команды, это уже frontier-level по качеству, при этом ценник у модели агрессивно ниже рынка. при этом по бенчмаркам она даже обгоняет opus 4.6 в целом это выглядит как…

cursor composer 2 оказался kimi k2.5 с reinforcement learning

новая модель cursor, анонсированная как «frontier-level coding performance», по сути является kimi k2.5 от moonshot ai, дообученная с помощью reinforcement learning (обучение с подкреплением — это когда модель учится методом проб и ошибок)

наверное это и логично, зачем делать полностью своё и тртатить время, если можно взять хороший код с полки и докрутить. но тем не менее я чуть удивился, думал у ребят что-то своё

но есть нюанс — moonshot ai публично обвинил cursor в нарушении лицензии (cursor зарабатывает ~$167M/мес, а лицензия требует указывать Kimi K2.5 при доходе выше $20M/мес)

upd: вроде cursor всё объяснили, они тренировали модель через посредника с лицензией и что-то такое. интересно, вероятно они не хотели чтобы это всплыло

https://news.ycombinator.com/item?id=47452404

❤3

273 viewsedited 15:52

Пупырка AI

openai выпустили гайд: как делать фронтенд с gpt-5.4
https://developers.openai.com/blog/designing-delightful-frontends-with-gpt-5-4

openai опубликовали практическое руководство для дизайнеров и разработчиков — как получить production-ready интерфейс с помощью gpt-5.4. авторы — инженеры openai, которые сами строили фронтенды с моделью.

почему gpt-5.4 другой:
первая модель openai обученная на computer use — она сама открывает браузер, смотрит как выглядит результат, находит баги и итерирует без участия человека. в связке с playwright может тестировать разные viewport'ы и фиксить интерфейс в цикле. для дизайнера это значит: можно описать интерфейс и получить рабочий прототип, не передавая задачу разработчику.

конкретные рекомендации из гайда:

1. сначала moodboard — просить модель собрать несколько визуальных вариантов прежде чем выбирать финальные ассеты. описывать атрибуты: стиль, палитра, настроение, композиция.

2. точный промпт — если промпт расплывчатый, модель падает в самые частые паттерны из обучения (generic cards, слабый брендинг, перегруженный ui). чем конкретнее описан стиль — тем лучше результат.

3. frontend-skill — openai выпустили отдельный скилл (набор инструкций) который ставит модели правила вкуса: restraint, image-led hierarchy, cohesive motion. убирает шаблонность по умолчанию.

4. playwright для проверки — давать модели инструмент для инспекции рендера. это значительно повышает шанс получить завершённый, функционально полный интерфейс.

Openai

Designing delightful frontends with GPT-5.4 | OpenAI Developers

Practical techniques for steering GPT-5.4 toward polished, production-ready frontend designs.

❤10

260 views13:49

Пупырка AI

новое интервью Андрея Карпати
youtube.com

интересно как поменялось его отношение меньше чем за год. в августе он рассуждал про то как ai частично дополняет его код. после прорыва модели в декабре к февралю он подошел с тем, что 99% кода за него пишет нейросеть. а основная проблема даже не качество моделей, а передача контекста.

сейчас он говорит о налаживании взаимодействий между агентами, рассуждает о изменениях в физическом мире и о том, что поменяется в профессиях в ближайшем будущем.

YouTube

Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI

What happens when AI agents can design experiments, collect data, and improve — without a human in the loop? Andrej Karpathy joins Sarah Guo on the state of models, the future of engineering and education, thinking about impact on jobs, and his project AutoResearch:…

171 viewsedited 11:54

Пупырка AI

обзор основных поинтов:

— кодинг стал не про писать, а про выражать намерение. карпати прямо формулирует это как сдвиг от writing code к delegation/manifests for agents. его тезис: бутылочное горлышко больше не скорость набора на клавиатуре, а умение правильно ставить задачи, держать контекст, запускать несколько агентных потоков и организовывать их работу.

— новый дефицит — не compute, а token throughput и orchestration. одна из сильных идей: раньше люди были зациклены на flops и gpu, а теперь практический bottleneck для отдельного человека все больше в том, насколько эффективно он прогоняет токены через модели и насколько хорошо организует параллельную работу агентов. то есть выигрывает не тот, кто лучше пишет код, а тот, кто лучше строит loops, memory, task queues, agent.md / program.md и вообще среду для агентов.

— он считает, что большинство провалов агентов — это пока skill issue, а не потолок моделей. это, пожалуй, один из самых спорных, но важных тезисов. карпати склонен трактовать неудачи агентов не как модели еще не умеют, а как проблему инструкции, памяти, организации контекста, неудачного интерфейса или плохой обвязки. то есть он смотрит на сбой как на повод дооптимизировать систему. но он одновременно признает jaggedness: модели могут выглядеть как очень сильные инженеры в одной задаче и как дети в другой.

— autoresearch для него — не игрушка, а намек на автоматизацию самого research loop. важный блок интервью — про autoresearch. идея в том, что агент может не просто помочь с кодом, а замкнуть исследовательский цикл: менять training code, запускать эксперименты, смотреть метрики, предлагать следующие шаги. это уже не агент пишет функцию, а агент исследует, как лучше исследовать.

— самая быстрая трансформация будет в digital-only работе. еще одна ключевая мысль: все, что связано с манипуляцией цифровой информацией, будет меняться быстрее всего. причина простая — биты копируются почти бесплатно, а атомы нет. поэтому software, research, digital operations, knowledge work и прочие чисто цифровые профессии будут перестраиваться раньше и сильнее, чем robotics или physical-world automation.

❤3

165 views11:54

Пупырка AI

и ещё 5 пунктов:

— физический мир запаздывает, но интерфейс между digital и physical — огромная возможность. карпати не говорит, что robotics не важна. наоборот: он считает, что после первой волны разблокировки цифрового труда следующий большой слой — это интерфейсы между цифровым интеллектом и физическим миром: sensors, cameras, lab equipment, actuators, сбор данных из реальности и выполнение действий в реальном мире. но из-за того, что atoms are much harder, это будет двигаться медленнее, чем pure digital ai.

— по jobs он осторожен: профессии не обязательно исчезнут, но набор задач внутри них поменяется. на вопрос о рынке труда он не дает громких прогнозов вида — инженеров станет меньше. скорее его позиция такая — jobs — это bundles of tasks, и часть задач внутри профессий теперь можно делать намного быстрее. что это сделает с общим числом рабочих мест, зависит уже не только от технологий, но и от спроса, эластичности рынка и экономики в целом.

— open source, по его мнению, будет отставать от закрытых моделей, но останется критически важным. карпати говорит, что закрытые frontier-модели пока впереди, а open models обычно отстают на месяцы. но он не считает, что из этого следует доминирование closed-only мира. его ожидание: open source будет покрывать огромный массив “обычных” use cases, включая локальный запуск, а frontier closed models останутся для самых сложных задач. при этом он прямо озвучивает опасение по поводу чрезмерной централизации интеллекта в закрытых системах.

— он ждет не только монокультуру, но и speciation моделей. интересная часть — про speciation. сейчас индустрия толкается в сторону “одна гигантская модель на все”, но карпати допускает, что позже возникнет более разнообразная экосистема специализированных моделей: с общим когнитивным ядром, но оптимизированных под разные классы задач. это похоже на аргумент против идеи, что один универсальный foundation model навсегда поглотит все остальное.

— education тоже меняется: документация и объяснения все чаще пишутся уже не для людей, а для агентов. в концовке он высказывает довольно радикальную мысль: образование и документация будут частично перенаправлены на агентную аудиторию. его пример — вместо html-документации для людей все важнее markdown / structured docs для агентов. человеческая ценность тогда смещается в few bits of insight: придумать хорошую идею, упростить концепцию, выбрать правильный фрейминг, а не тратить время на объяснение того, что агент и так уже сможет разжевать сам.

❤4

164 views11:54

About

Blog

Apps

Platform