Anthropic добавит базы знаний в Claude Cowork
Anthropic меняет архитектуру приложения Claude. Компания тестирует обновление, которое превратит Cowork из отдельной функции в центр всей работы с ИИ-ассистентом. Вместе с этим появятся базы знаний, голосовой режим и улучшенный Pixelate.
Главное изменение - Cowork становится основным интерфейсом. Раньше это был отдельный режим для рабочих задач. Теперь обычный чат встраивается в Cowork как одна из функций. Если нужно просто поболтать с Claude, можно открыть чат прямо внутри рабочего режима. Не надо переключаться между разделами.
https://mltimes.ai/anthropic-dobavit-bazy-znanij-v-claude-cowork/
Anthropic меняет архитектуру приложения Claude. Компания тестирует обновление, которое превратит Cowork из отдельной функции в центр всей работы с ИИ-ассистентом. Вместе с этим появятся базы знаний, голосовой режим и улучшенный Pixelate.
Главное изменение - Cowork становится основным интерфейсом. Раньше это был отдельный режим для рабочих задач. Теперь обычный чат встраивается в Cowork как одна из функций. Если нужно просто поболтать с Claude, можно открыть чат прямо внутри рабочего режима. Не надо переключаться между разделами.
https://mltimes.ai/anthropic-dobavit-bazy-znanij-v-claude-cowork/
❤1
Кто там хотел локальной Claude Code ?
ollama с версии 0.14 поддерживает Anthropic Messages API, что позволяет использовать Claude Code с локальными моделями вроде qwen3-coder или GPT-OSS.
Говорят, что нужно переключить переменные окружения вот так
И потом запустить примерно так
Еще говорят, что после такого люди сразу начинают понимать ценность стандартной подписки на Claude Code))
Ваш, @llm_under_hood 🤗
ollama с версии 0.14 поддерживает Anthropic Messages API, что позволяет использовать Claude Code с локальными моделями вроде qwen3-coder или GPT-OSS.
Говорят, что нужно переключить переменные окружения вот так
{
"env": {
"ANTHROPIC_BASE_URL": "https://localhost:11434",
"ANTHROPIC_AUTH_TOKEN": "ollama",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
}
}
И потом запустить примерно так
claude --model qwen3-coder
Еще говорят, что после такого люди сразу начинают понимать ценность стандартной подписки на Claude Code))
Ваш, @llm_under_hood 🤗
На этой неделе я сделал трёх своих друзей бытовыми инвалидами.
Показал им Claude Code. Это агент, который живёт в терминале. Видит твои файлы, читает их, пишет новые, запускает команды, может все тоже самое, что и ты. Ты даёшь задачу — он разбивает её на куски, запускает под каждый кусок субагента, проверяет результат.
То же самое можно делать в Codex, в Gemini CLI. Но в Claude Code сейчас это работает наиболее нативно. Очевидно, что все туда придут.
Главное — skills.md, возможность создавать своих агентов. Если понимаешь, как делается задача, — за несколько часов объясняешь это модели. На выходе получаешь агента, который будет делать эту задачу за тебя. Снова и снова.
Ты не обязан быть специалистом. Достаточно понимать, как ставить задачу и контролировать результат.
Руководил программистами — теперь сам пишешь код. Контролировал юристов по договорам — теперь сам проверяешь договоры. Ставил ТЗ дизайнерам — теперь сам делаешь макеты.
Менеджер становится исполнителем.
Все трое моих друзей — люди серьёзные. Предприниматели, руководители. Один из них публично написал: "Задачу, которую я решал бы месяц, тут получилось сделать за час".
Все трое — активные пользователи LLM с декабря 2022. Ни одной новинки не пропустили. И всё равно неделю не выходят на связь.
А когда выходят — сидят как дети. Таращатся в терминал и хихикают. Отгородились от мира, где их сотрудники чего-то хотят.
По моим ощущениям, это самый большой скачок в генеративках с момента GPT-3.5.
Помнишь ноябрь 2022? Ощущение, что мир изменился. Twitter в скриншотах. Сейчас то же самое. Только тише.
Люди перестали успевать. Модели выходят быстрее, чем старые. Пока разбираешься с одной — анонсируют следующую. Нормальный человек и не может успевать. Если у тебя есть любая работа кроме слежения за ИИ — ты не успеешь.
Попробуй с ходу: Strawberry (если что одна из главных моделей в цепочки эволюции). Что это? Без гугла — вряд ли.
Это не упрёк. Это диагноз.
Подсмотрено
Показал им Claude Code. Это агент, который живёт в терминале. Видит твои файлы, читает их, пишет новые, запускает команды, может все тоже самое, что и ты. Ты даёшь задачу — он разбивает её на куски, запускает под каждый кусок субагента, проверяет результат.
То же самое можно делать в Codex, в Gemini CLI. Но в Claude Code сейчас это работает наиболее нативно. Очевидно, что все туда придут.
Главное — skills.md, возможность создавать своих агентов. Если понимаешь, как делается задача, — за несколько часов объясняешь это модели. На выходе получаешь агента, который будет делать эту задачу за тебя. Снова и снова.
Ты не обязан быть специалистом. Достаточно понимать, как ставить задачу и контролировать результат.
Руководил программистами — теперь сам пишешь код. Контролировал юристов по договорам — теперь сам проверяешь договоры. Ставил ТЗ дизайнерам — теперь сам делаешь макеты.
Менеджер становится исполнителем.
Все трое моих друзей — люди серьёзные. Предприниматели, руководители. Один из них публично написал: "Задачу, которую я решал бы месяц, тут получилось сделать за час".
Все трое — активные пользователи LLM с декабря 2022. Ни одной новинки не пропустили. И всё равно неделю не выходят на связь.
А когда выходят — сидят как дети. Таращатся в терминал и хихикают. Отгородились от мира, где их сотрудники чего-то хотят.
По моим ощущениям, это самый большой скачок в генеративках с момента GPT-3.5.
Помнишь ноябрь 2022? Ощущение, что мир изменился. Twitter в скриншотах. Сейчас то же самое. Только тише.
Люди перестали успевать. Модели выходят быстрее, чем старые. Пока разбираешься с одной — анонсируют следующую. Нормальный человек и не может успевать. Если у тебя есть любая работа кроме слежения за ИИ — ты не успеешь.
Попробуй с ходу: Strawberry (если что одна из главных моделей в цепочки эволюции). Что это? Без гугла — вряд ли.
Это не упрёк. Это диагноз.
❤4
Огроооомная библиотека скиллов для Claude Code
Такой, каталог‑маркетплейс, где можно искать, просматривать и забирать созданные сообществом скиллы для Клод Код, с фильтрацией по категориям, авторам и популярности.
Внутри более 70,000 скиллов.
Забираем тут.
#library@TochkiNadAI
Такой, каталог‑маркетплейс, где можно искать, просматривать и забирать созданные сообществом скиллы для Клод Код, с фильтрацией по категориям, авторам и популярности.
Внутри более 70,000 скиллов.
Забираем тут.
#library@TochkiNadAI
🔥1
Роботы Яндекса стоят на 66% дешевле курьеров
Аналитики Совкомбанка подсчитали затраты на роботов-доставщиков Яндекса по данным за 2025 год. Содержание ровера обходится на 49-66% дешевле работы курьеров.
Один робот стоит 10 тысяч долларов. Их собирают в Китае. Один оператор управляет 12 машинами, один инженер обслуживает 24 ровера. Годовое обслуживание робота стоит 295 тысяч рублей. Из них 58% идет на ремонт и запчасти, 42% - на зарплату оператора и инженера.
https://mltimes.ai/roboty-yandeksa-stoyat-na-66-deshevle-kurerov/
Аналитики Совкомбанка подсчитали затраты на роботов-доставщиков Яндекса по данным за 2025 год. Содержание ровера обходится на 49-66% дешевле работы курьеров.
Один робот стоит 10 тысяч долларов. Их собирают в Китае. Один оператор управляет 12 машинами, один инженер обслуживает 24 ровера. Годовое обслуживание робота стоит 295 тысяч рублей. Из них 58% идет на ремонт и запчасти, 42% - на зарплату оператора и инженера.
https://mltimes.ai/roboty-yandeksa-stoyat-na-66-deshevle-kurerov/
❤1
Самый частый вопрос: «Какие AI-сервисы посоветуешь?»
Окей. Есть движки (Midjourney, Runway, Sora, VEO, Nana Banana), есть обёртки с UI (Freepik, Fal.ai, Flow), есть нишевые продукты (Arcads), есть оркестраторы (ComfyUI, n8n, Claude Code) - пишу тут неполные списки, чтобы не разгонять текст на два поста. Гугли/Перплекси любой слой — найдёшь десятки.
Но я не понимаю, зачем вам эти списки.
90% либо сохранят в закладки навечно, либо попробуют, получат мусор и скажут «фигня ваш AI».
Тем временем соегодя команды, которые делают 100% креативов, кода, расчета на AI. В проде, каждый день.
Разница:
— Они умели делать креативы, код, расчеты *до* AI
— У них есть насмотренность
— Они просто берут и пробуют, пока не получат результат
Сервис — молоток. Вопрос не какой молоток лучше. Вопрос — умеешь ли ты забивать гвозди.
Окей. Есть движки (Midjourney, Runway, Sora, VEO, Nana Banana), есть обёртки с UI (Freepik, Fal.ai, Flow), есть нишевые продукты (Arcads), есть оркестраторы (ComfyUI, n8n, Claude Code) - пишу тут неполные списки, чтобы не разгонять текст на два поста. Гугли/Перплекси любой слой — найдёшь десятки.
Но я не понимаю, зачем вам эти списки.
90% либо сохранят в закладки навечно, либо попробуют, получат мусор и скажут «фигня ваш AI».
Тем временем соегодя команды, которые делают 100% креативов, кода, расчета на AI. В проде, каждый день.
Разница:
— Они умели делать креативы, код, расчеты *до* AI
— У них есть насмотренность
— Они просто берут и пробуют, пока не получат результат
Сервис — молоток. Вопрос не какой молоток лучше. Вопрос — умеешь ли ты забивать гвозди.
❤2💯2
💯 Anthropic занимает ~60% рынка моделей для кодинга.
Давно хотелось посмотреть на такой график, но вот только сейчас он попался в отчете OpenRouter под названием State of AI.
Любопытен он двумя вещами:
❶ Во-первых, он показывает весь spend, а не только затраты на API, как показывает в своих отчетах Menlo Ventures.
❷ Во-вторых, помимо очевидной и гигантской доминации Anthropic, еще любопытно посмотреть за вторым местом:
▪️На неделе с 19 мая 2025 после Anthropic огромную долю занимал OpenAI, а далее шел Google.
▪️А через неделю случился просто захват рынка со стороны Anthropic – при этом, доля Google не пострадала, а вот OpenAI отдал почти 2/3 своей доли рынка в пользу Anthropic. А в июле-августе их доля вообще стала крайне маленькой – появились XAI и Qwen на этом рынке.
▪️По итогу OpenAI выправилась, а xAI и Qwen (и другие) по сути отняли немного долю у Anthropic.
👉 Читайте отчет от OpenRouter по ссылке: https://openrouter.ai/state-of-ai
💾👉 Отчет был взят из подборки 50+ лучших отчетов по AI за 2025 год: https://vchappens.substack.com/p/all-the-2025-ai-reports-you-need
@proVenture
#research #ai #coding #trends
Давно хотелось посмотреть на такой график, но вот только сейчас он попался в отчете OpenRouter под названием State of AI.
Любопытен он двумя вещами:
❶ Во-первых, он показывает весь spend, а не только затраты на API, как показывает в своих отчетах Menlo Ventures.
❷ Во-вторых, помимо очевидной и гигантской доминации Anthropic, еще любопытно посмотреть за вторым местом:
▪️На неделе с 19 мая 2025 после Anthropic огромную долю занимал OpenAI, а далее шел Google.
▪️А через неделю случился просто захват рынка со стороны Anthropic – при этом, доля Google не пострадала, а вот OpenAI отдал почти 2/3 своей доли рынка в пользу Anthropic. А в июле-августе их доля вообще стала крайне маленькой – появились XAI и Qwen на этом рынке.
▪️По итогу OpenAI выправилась, а xAI и Qwen (и другие) по сути отняли немного долю у Anthropic.
👉 Читайте отчет от OpenRouter по ссылке: https://openrouter.ai/state-of-ai
💾👉 Отчет был взят из подборки 50+ лучших отчетов по AI за 2025 год: https://vchappens.substack.com/p/all-the-2025-ai-reports-you-need
@proVenture
#research #ai #coding #trends
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Cowork теперь доступен в подписке за 20$
Я его попробовал - реально как Claude Code, только с человеческим пользовательским интерфейсом.
Основной юзкейс выглядит так:
1. Выбираю папку (например, папка с медицинскими анализами, или с чеками по расходам, или с личной crm.в файлах)
2. Говорю что сделать (примерно как Курсору в моих кейсах)
3. Он делает. Читает файлы, инструкции, гуглит, разбирается, перепроверяет
По сути это ещё один шаг от IDE для разработчиков к чему-то более юзер-френдли.
Отдельно удивляет факт, что интерфейс Claude Cowork был разработан и выпущен как Research Preview за 10 дней 😜 Да, под капотом это тот же Claude Code, и писать надо было только интерфейс и некоторые ограничения, но всё же. Продукт с миллионами пользователей за 10 дней - это что-то!
https://claudecowork.io/
Я его попробовал - реально как Claude Code, только с человеческим пользовательским интерфейсом.
Основной юзкейс выглядит так:
1. Выбираю папку (например, папка с медицинскими анализами, или с чеками по расходам, или с личной crm.в файлах)
2. Говорю что сделать (примерно как Курсору в моих кейсах)
3. Он делает. Читает файлы, инструкции, гуглит, разбирается, перепроверяет
По сути это ещё один шаг от IDE для разработчиков к чему-то более юзер-френдли.
Отдельно удивляет факт, что интерфейс Claude Cowork был разработан и выпущен как Research Preview за 10 дней 😜 Да, под капотом это тот же Claude Code, и писать надо было только интерфейс и некоторые ограничения, но всё же. Продукт с миллионами пользователей за 10 дней - это что-то!
https://claudecowork.io/
👍2
Нейропесни все заметнее в чартах российских стримингов — как это влияет на индустрию
«Ведомости» пишут, что за новогодние праздники AI-песню «Расскажи, Снегурочка» проекта Sasha Komovich прослушали 2 млн подписчиков «Плюса» в Яндекс.Музыке. На других площадках трек тоже входил в топы.
На конференции Music Ally Connect 2026 в Лондоне главной темой стал AI в музыке. Эксперты считают, что новатор Дэвид Боуи увидел бы в нейросетях помощника для творчества, а не врага. Джонатан Дворкин из Universal Music Group говорит, что в какой-то момент станет слишком много низкокачественной музыки, созданной AI, и слушатели начнут больше ценить настоящее — живые эмоции и подлинное искусство. Это откроет новые возможности для лейблов, которые смогут предложить фанатам качественный контент.
Однако пока слушатель лайкает нейротреки, даже не замечая, что они сгенерированы машиной. И это может демотивировать музыкантов, которые годами развивают голос, стиль и качество записи. При этом сами артисты тоже используют AI — для черновиков текстов, идей и аранжировок. Вопрос, как и в других сферах, сводится к тому, чем станет AI — полезным инструментом или заменой человека.
Вместе с этим обостряется и вопрос авторского права: часть AI-контента фактически подменяет чужой голос или стиль без согласия правообладателей — и это уже прямое нарушение.
@volotovskayaelena
«Ведомости» пишут, что за новогодние праздники AI-песню «Расскажи, Снегурочка» проекта Sasha Komovich прослушали 2 млн подписчиков «Плюса» в Яндекс.Музыке. На других площадках трек тоже входил в топы.
На конференции Music Ally Connect 2026 в Лондоне главной темой стал AI в музыке. Эксперты считают, что новатор Дэвид Боуи увидел бы в нейросетях помощника для творчества, а не врага. Джонатан Дворкин из Universal Music Group говорит, что в какой-то момент станет слишком много низкокачественной музыки, созданной AI, и слушатели начнут больше ценить настоящее — живые эмоции и подлинное искусство. Это откроет новые возможности для лейблов, которые смогут предложить фанатам качественный контент.
Однако пока слушатель лайкает нейротреки, даже не замечая, что они сгенерированы машиной. И это может демотивировать музыкантов, которые годами развивают голос, стиль и качество записи. При этом сами артисты тоже используют AI — для черновиков текстов, идей и аранжировок. Вопрос, как и в других сферах, сводится к тому, чем станет AI — полезным инструментом или заменой человека.
Вместе с этим обостряется и вопрос авторского права: часть AI-контента фактически подменяет чужой голос или стиль без согласия правообладателей — и это уже прямое нарушение.
@volotovskayaelena
Media is too big
VIEW IN TELEGRAM
👍1
Как усиливание «внутренних маркеров диалога» может улучшить точность LLM в два раза 😮
Интересное исследование от Google рассказывает, как даже такие мелочи, как слова типа «Oh» или «Wait», могут значительно улучшить производительность языковых моделей на сложных задачах. Кто бы мог подумать, что внутренняя симуляция диалога между различными «голосами» модели может так повлиять на её способности? Но это реально работает.
Итак, LLM ещё изучены очень мало, и мы даже не подозреваем, сколько всего скрыто внутри их работы. Попробуйте в промпте добавить несколько таких слов, возможно, это даст какие либо результаты.
Data Science
Интересное исследование от Google рассказывает, как даже такие мелочи, как слова типа «Oh» или «Wait», могут значительно улучшить производительность языковых моделей на сложных задачах. Кто бы мог подумать, что внутренняя симуляция диалога между различными «голосами» модели может так повлиять на её способности? Но это реально работает.
В статье говорится, что RL (Reinforcement Learning) не просто помогает моделям думать быстрее, а учит их думать коллективно. Представьте, что у модели несколько внутренних голосов, которые ведут между собой диалог. Они задают вопросы, отвечают друг другу, критикуют и высказывают сомнения. И именно этот внутренний диалог и есть ризонинг (или «логическое рассуждение») модели.
Как это проверили?👌
Для эксперимента Google использовали sparse autoencoder. Они нашли один нейронный признак, который отвечает за удивление или смену точки зрения. Это тот момент, когда модель в процессе рассуждения начинает думать: «Ага! Понял!». Для этого использовались такие фразы, как «Oh» или «Wait», которые обозначают переход к новому пониманию.
Далее они усилили этот признак и проверили, как это влияет на точность модели. Что получилось?
• Обычная модель без усиленных маркеров давала 27,1% точности на задачах по комбинаторной арифметике
• Модель с усилением маркера «внутреннего диалога» показала 54,8% точности. В два раза больше!
• А если усиливать другие признаки, то разница была не такой впечатляющей
Итак, LLM ещё изучены очень мало, и мы даже не подозреваем, сколько всего скрыто внутри их работы. Попробуйте в промпте добавить несколько таких слов, возможно, это даст какие либо результаты.
Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышел продвинутый ИИ-агент Clawd: умеет автоматизировать почти все задачи на вашем ПК.
Есть больше 50 интеграций с разными сервисами. Можно подключить его к Telegram, календарю, плееру или браузеру и так далее. Поддерживаются все популярные нейронки. Работает полностью локально.
Редактор NN за пару минут сделал Telegram-бота с прогнозами погоды, который обновляется каждый час.
Забираем бесплатно по ссылке.
Есть больше 50 интеграций с разными сервисами. Можно подключить его к Telegram, календарю, плееру или браузеру и так далее. Поддерживаются все популярные нейронки. Работает полностью локально.
Редактор NN за пару минут сделал Telegram-бота с прогнозами погоды, который обновляется каждый час.
Забираем бесплатно по ссылке.
👍2🤝1
AI_CX_Growth_2025.pdf
17.5 MB
Как же я люблю, то что делаю! Кто бы мог подумать, что я делаю то, что тут нарисовано на слайдах - а кто мне в этом помог - ИИ, а почему так все круто, а было из чего улучшать!
ИИ это множитель - если вам есть что умножить - ИИ для вас!
Готовлю материалы к новым микро-МБА в вузах где преподаю. С прошедшим Вас днем студента!
ИИ это множитель - если вам есть что умножить - ИИ для вас!
Готовлю материалы к новым микро-МБА в вузах где преподаю. С прошедшим Вас днем студента!
👍3
Media is too big
VIEW IN TELEGRAM
Doppl — экспериментальное AI-приложение от Google Labs для виртуальной примерки одежды. Запущено в середине 2025 года, только США, 18+.
Как работает
Загружаешь фото в полный рост → выбираешь наряды из интернета (любой источник, не только магазины) → AI генерирует фото/видео, как это будет на тебе выглядеть. Использует генеративный AI и компьютерное зрение для создания анимированных клипов.
Функции
Discovery Feed (добавлен декабрь 2025) — персонализированная лента с AI-видео реальных товаров, почти всё shoppable с прямыми ссылками на магазины
- Collections — сохранение понравившихся образов
- Анимация — превращение статичных луков в короткое видео
- Загрузка своих фото одежды или съемка в реальном времени
Контекст
Развитие функции виртуальной примерки из Google Shopping, которая работала пару лет. Doppl расширяет концепцию: можешь примерять одежду откуда угодно из интернета, не только из поисковой выдачи. Фактически — попытка Google заменить инфлюенсеров AI-контентом в формате TikTok/Instagram feed.
Приложение экспериментальное, будет развиваться через фидбек пользователей.
Для брендов — новый канал discovery + потенциальное снижение возвратов. Для Google — шаг к AI-стилистам и интеграции shopping в социальную механику.
Как работает
Загружаешь фото в полный рост → выбираешь наряды из интернета (любой источник, не только магазины) → AI генерирует фото/видео, как это будет на тебе выглядеть. Использует генеративный AI и компьютерное зрение для создания анимированных клипов.
Функции
Discovery Feed (добавлен декабрь 2025) — персонализированная лента с AI-видео реальных товаров, почти всё shoppable с прямыми ссылками на магазины
- Collections — сохранение понравившихся образов
- Анимация — превращение статичных луков в короткое видео
- Загрузка своих фото одежды или съемка в реальном времени
Контекст
Развитие функции виртуальной примерки из Google Shopping, которая работала пару лет. Doppl расширяет концепцию: можешь примерять одежду откуда угодно из интернета, не только из поисковой выдачи. Фактически — попытка Google заменить инфлюенсеров AI-контентом в формате TikTok/Instagram feed.
Приложение экспериментальное, будет развиваться через фидбек пользователей.
Для брендов — новый канал discovery + потенциальное снижение возвратов. Для Google — шаг к AI-стилистам и интеграции shopping в социальную механику.
This media is not supported in your browser
VIEW IN TELEGRAM
MiniMax обновил AI-агента для управления компьютером
MiniMax Agent Desktop умеет сортировать файлы, писать посты в соцсети, генерировать картинки и использовать облачных AI-агентов.
Доверить свой компьютер китайскому ответу Claude Cowork можно тут: https://agent.minimax.io/. Работает на Windows и macOS.
MiniMax Agent Desktop умеет сортировать файлы, писать посты в соцсети, генерировать картинки и использовать облачных AI-агентов.
Доверить свой компьютер китайскому ответу Claude Cowork можно тут: https://agent.minimax.io/. Работает на Windows и macOS.
Какова цена AGI?
Через 1-2 года появится ИИ умнее нобелевских лауреатов по всем дисциплинам. Не в одной области — во всех сразу. Способный работать автономно неделями. Запускаться в миллионах копий. На скорости в сто раз выше человеческой.
Это не я придумал. Это пишет Дарио Амодеи, CEO Anthropic, в новом эссе «The Adolescence of Technology». Человек, который строит эти системы изнутри и видит, как следующие модели уже формируются в пайплайне.
Год назад он описывал светлое будущее — победу над болезнями, экономическое изобилие, расцвет науки. Теперь пришло время говорить о цене входного билета.
Пять рисков, которые нас ждут
1. Автономный ИИ с собственной повесткой. Модели уже сейчас — в лабораторных экспериментах Anthropic — шантажируют операторов, обманывают тестировщиков, хакают reward-функции. Это не баги. Это эмерджентное поведение систем, которые «выращивают», а не «программируют».
2. Биооружие в руках одиночек. LLM уже дают 2-3x прирост эффективности в биосинтезе по внутренним замерам Anthropic. ИИ ломает корреляцию между способностью уничтожать и моральными ограничениями. Раньше собрать патоген мог только PhD с карьерой и репутацией — человек, которому есть что терять. Скоро это сможет любой фрик с интернетом.
3. Захват власти через технологии. Рои автономных дронов, тотальная слежка, персонализированная пропаганда, «виртуальный Бисмарк» для оптимизации удержания контроля. Китай отстаёт на 1-2 года — и это единственный конкурент, у остальных шансов нет.
4. Сами AI-компании. Уникальная комбинация: экспертиза + вычислительная инфраструктура + влияние на сотни миллионов пользователей. Anthropic это про себя тоже пишет.
5. Коллапс рынка труда. ИИ может дать 10-20% роста ВВП в год. Но отличие от прошлых революций: ИИ покрывает почти весь когнитивный труд сразу. Людям некуда переучиваться — новых профессий не будет, потому что ИИ займёт и их тоже.
Что предлагается делать
- Амодеи не просто пугает. Он описывает конкретные защитные механизмы:
- Constitutional AI — тренировка модели на характер, а не на список запретов. Цель: чтобы модель хотела быть хорошей, а не притворялась
- Mechanistic interpretability — буквально вскрыть «мозг» модели и видеть, как она думает изнутри
- Классификаторы на выводе против биоугроз (~5% стоимости инференса)
- Федеральный скрининг генного синтеза (которого сейчас нет в США — 36 из 38 провайдеров выполнили заказ с геномом гриппа 1918 года в эксперименте MIT)
- Международные нормы против AI-тоталитаризма
- Корпоративная подотчётность AI-компаний
Что это значит для тебя
Амодеи пишет, что все кофаундеры Anthropic отдают 80% своего состояния на благотворительность. Это не альтруизм — это страховка людей, которые видят распределение вероятностей изнутри.
Если ты строишь бизнес — горизонт планирования сжался до 2-3 лет. Всё, что можно автоматизировать когнитивно, будет автоматизировано. Вопрос не «если», а «когда именно в этом окне».
Время действовать наступило вчера. Не в смысле паниковать — в смысле перестать планировать линейно в мире, который меняется экспоненциально.
Полное эссе: darioamodei.com/essay/the-adolescence-of-technology
Через 1-2 года появится ИИ умнее нобелевских лауреатов по всем дисциплинам. Не в одной области — во всех сразу. Способный работать автономно неделями. Запускаться в миллионах копий. На скорости в сто раз выше человеческой.
Это не я придумал. Это пишет Дарио Амодеи, CEO Anthropic, в новом эссе «The Adolescence of Technology». Человек, который строит эти системы изнутри и видит, как следующие модели уже формируются в пайплайне.
Год назад он описывал светлое будущее — победу над болезнями, экономическое изобилие, расцвет науки. Теперь пришло время говорить о цене входного билета.
Пять рисков, которые нас ждут
1. Автономный ИИ с собственной повесткой. Модели уже сейчас — в лабораторных экспериментах Anthropic — шантажируют операторов, обманывают тестировщиков, хакают reward-функции. Это не баги. Это эмерджентное поведение систем, которые «выращивают», а не «программируют».
2. Биооружие в руках одиночек. LLM уже дают 2-3x прирост эффективности в биосинтезе по внутренним замерам Anthropic. ИИ ломает корреляцию между способностью уничтожать и моральными ограничениями. Раньше собрать патоген мог только PhD с карьерой и репутацией — человек, которому есть что терять. Скоро это сможет любой фрик с интернетом.
3. Захват власти через технологии. Рои автономных дронов, тотальная слежка, персонализированная пропаганда, «виртуальный Бисмарк» для оптимизации удержания контроля. Китай отстаёт на 1-2 года — и это единственный конкурент, у остальных шансов нет.
4. Сами AI-компании. Уникальная комбинация: экспертиза + вычислительная инфраструктура + влияние на сотни миллионов пользователей. Anthropic это про себя тоже пишет.
5. Коллапс рынка труда. ИИ может дать 10-20% роста ВВП в год. Но отличие от прошлых революций: ИИ покрывает почти весь когнитивный труд сразу. Людям некуда переучиваться — новых профессий не будет, потому что ИИ займёт и их тоже.
Что предлагается делать
- Амодеи не просто пугает. Он описывает конкретные защитные механизмы:
- Constitutional AI — тренировка модели на характер, а не на список запретов. Цель: чтобы модель хотела быть хорошей, а не притворялась
- Mechanistic interpretability — буквально вскрыть «мозг» модели и видеть, как она думает изнутри
- Классификаторы на выводе против биоугроз (~5% стоимости инференса)
- Федеральный скрининг генного синтеза (которого сейчас нет в США — 36 из 38 провайдеров выполнили заказ с геномом гриппа 1918 года в эксперименте MIT)
- Международные нормы против AI-тоталитаризма
- Корпоративная подотчётность AI-компаний
Что это значит для тебя
Амодеи пишет, что все кофаундеры Anthropic отдают 80% своего состояния на благотворительность. Это не альтруизм — это страховка людей, которые видят распределение вероятностей изнутри.
Если ты строишь бизнес — горизонт планирования сжался до 2-3 лет. Всё, что можно автоматизировать когнитивно, будет автоматизировано. Вопрос не «если», а «когда именно в этом окне».
Время действовать наступило вчера. Не в смысле паниковать — в смысле перестать планировать линейно в мире, который меняется экспоненциально.
Полное эссе: darioamodei.com/essay/the-adolescence-of-technology
Darioamodei
Dario Amodei — The Adolescence of Technology
Confronting and Overcoming the Risks of Powerful AI
❤1
Anthropic запустила интерактивные приложения для Claude
Anthropic запустила интерактивные приложения внутри чат-бота Claude. Пользователи смогут вызывать рабочие инструменты прямо в интерфейсе.
На старте доступны Slack, Canva, Figma, Box и Clay. Интеграция с Salesforce появится в ближайшее время. Каждое приложение работает через авторизованную сессию. Claude получает доступ к сервису от имени пользователя.
https://mltimes.ai/anthropic-zapustila-interaktivnye-prilozheniya-dlya-claude/
Anthropic запустила интерактивные приложения внутри чат-бота Claude. Пользователи смогут вызывать рабочие инструменты прямо в интерфейсе.
На старте доступны Slack, Canva, Figma, Box и Clay. Интеграция с Salesforce появится в ближайшее время. Каждое приложение работает через авторизованную сессию. Claude получает доступ к сервису от имени пользователя.
https://mltimes.ai/anthropic-zapustila-interaktivnye-prilozheniya-dlya-claude/
Китайская модель Qwen3 обошла GPT-5.2 в тестах
Китайская Alibaba выпустила обновление Qwen3-Max-Thinking, которое меняет расклад сил на рынке ИИ-моделей. Главная сенсация - результат 90,2 балла на Arena-Hard v2. GPT-5.2 от OpenAI остался позади с 80,6 баллами. Claude Opus 4.5 набрал только 76,7.
Разрыв получился существенным. Китайская модель опередила американских конкурентов на 10 и 14 баллов соответственно. При этом Alibaba сделала её бесплатной на своем сайте chat.qwen.ai. Платный API тоже стоит в разы дешевле западных аналогов.
https://mltimes.ai/kitajskaya-model-qwen3-oboshla-gpt-5-2-v-testah/
Китайская Alibaba выпустила обновление Qwen3-Max-Thinking, которое меняет расклад сил на рынке ИИ-моделей. Главная сенсация - результат 90,2 балла на Arena-Hard v2. GPT-5.2 от OpenAI остался позади с 80,6 баллами. Claude Opus 4.5 набрал только 76,7.
Разрыв получился существенным. Китайская модель опередила американских конкурентов на 10 и 14 баллов соответственно. При этом Alibaba сделала её бесплатной на своем сайте chat.qwen.ai. Платный API тоже стоит в разы дешевле западных аналогов.
https://mltimes.ai/kitajskaya-model-qwen3-oboshla-gpt-5-2-v-testah/
❤1
У китайцев свой новый год, ждем плотный поток премьер и анонсов обновлений. Для справки в кремневой долине уже до 65% стартапов работают свои проекты на на китайских моделях - это просто в 10х раз дешевле. Но есть нюансы - недавно на презентации видел - как модель спросили: меня облили грязью в магазине - и упакованная модель - выдала ошибку 500) - КПК на самом низком уровне запретила ругать моделям власть, а власть в Китае начинается с ЖКХ - той самой тетки, которая с вас за ремонт деньги собирает)
Вышла Kimi K2.5 — самая мощная на сегодня открытая модель
Главное нововведение — режим Agent Swarm. В сложных задачах модель управляет роем из 100 субагентов и делает до 1500 вызовов инструментов.
В кодинге, судя по бенчмаркам, Kimi K2.5 работает на уровне Gemini 3 Pro.
Попробовать бесплатно можно тут: https://www.kimi.com/. Тестовый доступ к Agent Swarm дают только на дорогих тарифах.
Код и веса лежат на HuggingFace.
https://www.kimi.com/blog/kimi-k2-5.html
Вышла Kimi K2.5 — самая мощная на сегодня открытая модель
Главное нововведение — режим Agent Swarm. В сложных задачах модель управляет роем из 100 субагентов и делает до 1500 вызовов инструментов.
В кодинге, судя по бенчмаркам, Kimi K2.5 работает на уровне Gemini 3 Pro.
Попробовать бесплатно можно тут: https://www.kimi.com/. Тестовый доступ к Agent Swarm дают только на дорогих тарифах.
Код и веса лежат на HuggingFace.
https://www.kimi.com/blog/kimi-k2-5.html
❤2
Добавил в новость про китайские модели упоминание DeepSeek-OCR-2. Новый энкодер у них и правда интересный, не растр сканирует как все, а объекты и соответственно порядок визуальных токенов получается иной. Теперь и энкодеры у нас с ризонингом!
кому и зачем это нужно - система распознавание чеков, счетов, актов - работает мгновенно и точность 999.
кому и зачем это нужно - система распознавание чеков, счетов, актов - работает мгновенно и точность 999.
Я живу в будущем.
55 лет успешно избегал знать, что такое git, SSH-ключи и настройка хостинга. Маркетинг, реклама, стратегии — это пожалуйста. Но терминал? Не, спасибо, я на тот свет не тороплюсь.
И тут понадобилось поднять сервер на Supabase с репликацией на GitHub. Открыл Perplexity в браузере Comet, начал по шагам спрашивать как дурак. И в какой-то момент устал и сказал вслух: "Да настрой ты мне это сам уже."
Он и настроил.
- Смотрю — браузер сам ходит по вкладкам. Копирует IP-адреса. Вставляет ключи. Открывает GitHub, логинится под моим аккаунтом, генерирует API-токен. Возвращается на хостинг, прописывает репликацию. Я сижу с отвисшей челюстью и чувствую себя дедом, которому внук показал, что телевизор можно голосом переключать.
Что это было:
- Computer use — AI видит ваш экран и управляет мышью/клавиатурой
- Работает в Comet (браузер на базе Arc с интеграцией Perplexity/Claude)
- Умеет делать многошаговые задачи: переходить между сайтами, заполнять формы, копировать данные
Где взять:
- Comet Browser — cometbrowser.com (бета, computer use встроен)
- Claude Computer Use — напрямую через Anthropic API
- OpenAI Operator — аналог, пока waitlist
- Antigtagity Gemini IDE — супер умная система разработки (она прощелкивает готовые сайты и код). Я это уже использую для скринкастов - чтобы показать как будет работать приложение или сайт.
Не все из этого легко доступно в россии, но если потрудиться - то можно чуть чуть пожить уже в будущем.
Будущее не в том, что AI пишет код. Будущее в том, что AI делает за тебя скучную рутину, пока ты смотришь и киваешь.
55 лет успешно избегал знать, что такое git, SSH-ключи и настройка хостинга. Маркетинг, реклама, стратегии — это пожалуйста. Но терминал? Не, спасибо, я на тот свет не тороплюсь.
И тут понадобилось поднять сервер на Supabase с репликацией на GitHub. Открыл Perplexity в браузере Comet, начал по шагам спрашивать как дурак. И в какой-то момент устал и сказал вслух: "Да настрой ты мне это сам уже."
Он и настроил.
- Смотрю — браузер сам ходит по вкладкам. Копирует IP-адреса. Вставляет ключи. Открывает GitHub, логинится под моим аккаунтом, генерирует API-токен. Возвращается на хостинг, прописывает репликацию. Я сижу с отвисшей челюстью и чувствую себя дедом, которому внук показал, что телевизор можно голосом переключать.
Что это было:
- Computer use — AI видит ваш экран и управляет мышью/клавиатурой
- Работает в Comet (браузер на базе Arc с интеграцией Perplexity/Claude)
- Умеет делать многошаговые задачи: переходить между сайтами, заполнять формы, копировать данные
Где взять:
- Comet Browser — cometbrowser.com (бета, computer use встроен)
- Claude Computer Use — напрямую через Anthropic API
- OpenAI Operator — аналог, пока waitlist
- Antigtagity Gemini IDE — супер умная система разработки (она прощелкивает готовые сайты и код). Я это уже использую для скринкастов - чтобы показать как будет работать приложение или сайт.
Не все из этого легко доступно в россии, но если потрудиться - то можно чуть чуть пожить уже в будущем.
Будущее не в том, что AI пишет код. Будущее в том, что AI делает за тебя скучную рутину, пока ты смотришь и киваешь.
❤4👍2
Alibaba проверяет ИИ-агентов на умение укладываться в бюджет
Команда Alibaba выпустила DeepPlanning - бенчмарк для оценки ИИ-агентов в долгосрочном планировании. Тест проверяет способность работать с жесткими временными и финансовыми ограничениями. Это не пошаговое рассуждение, а глобальная оптимизация всего плана.
Бенчмарк включает два сложных домена. Первый - планирование многодневных путешествий с поминутным расписанием. Второй - сложный шопинг с комбинированием купонов. Каждая задача имитирует реальную среду с API для сбора информации.
https://mltimes.ai/alibaba-proveryaet-ii-agentov-na-umenie-ukladyvatsya-v-byudzhet/
Команда Alibaba выпустила DeepPlanning - бенчмарк для оценки ИИ-агентов в долгосрочном планировании. Тест проверяет способность работать с жесткими временными и финансовыми ограничениями. Это не пошаговое рассуждение, а глобальная оптимизация всего плана.
Бенчмарк включает два сложных домена. Первый - планирование многодневных путешествий с поминутным расписанием. Второй - сложный шопинг с комбинированием купонов. Каждая задача имитирует реальную среду с API для сбора информации.
https://mltimes.ai/alibaba-proveryaet-ii-agentov-na-umenie-ukladyvatsya-v-byudzhet/