Machinelearning

✔️

Anthropic тестирует исключение Claude Code для новых Pro-подписчиков

Anthropic убрала Claude Code из описания подписки Pro на странице тарифов.

Пользователи заметили это в 21 апреля, и уже через несколько часов компания объяснила, что речь идёт об эксперименте на небольшой группе новых пользователей, а не о массовом изменении плана.

Напротив Claude Code в колонке Pro теперь стоит крестик вместо галочки, а фраза о том, что инструмент входит в тариф, исчезла. При этом страница Claude Code и CLI-клиент по-прежнему показывают доступ для Pro, то есть правки внесены не везде, что и породило волнения в сети и путаницу.

Глава отдела развития Anthropic Амол Авасаре уточнил в X, что тест затрагивает около 2% новых регистраций и не касается действующих подписчиков Pro и Max.

По его словам, за год с запуска Max характер использования подписок изменился радикально: Claude Code встроили в Max, и он взлетел после релиза Opus 4, появился Cowork, а длительные асинхронные агенты стали повседневным сценарием. Под такую нагрузку текущие тарифы изначально не проектировались.

Anthropic уже несколько месяцев подряд закручивает гайки действуя по аналогии с тем, как энергокомпании снижают нагрузку на сеть. Причина банальна: стоимость подписки кратно ниже рыночной цены реально расходуемых токенов (по оценкам - иногда в 10 и более раз). С тем же дисбалансом уже столкнулись GitHub и Google.

На Reddit и в соцсетях подписчики восприняли эксперимент болезненно. Главная претензия, впрочем, не к самому изменению, а к коммуникации: правки на странице тарифов увидели все, хотя тест должен был затронуть лишь 2% пользователей.

Авасаре пообещал, что если эксперимент приведёт к пересмотру подписок для действующих клиентов, их уведомят заранее, "не скриншотом в X или на Reddit" (с).

Это сообщение он, впрочем, опубликовал именно в X.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔70🤬23👍18❤12😢10🔥3💔3😁1🌭1

22.7K views09:13

Machinelearning

🌟

Ai2 представил способ обновлять навыки LLM по одному, без полного ретрейна

Институт Аллена выпустил BAR - рецепт посттрейна, в котором доменные эксперты обучаются по отдельности, а затем собираются в единую MoE-модель через обучаемый роутер.

Метод снимает давнюю проблему: как добавить модели новый навык, не переобучая её целиком и не разрушая то, что она уже умела.

Замена код-эксперта на версию, обученную на более качественных данных с RL, даёт +16.5 пунктов на кодинге при почти нулевом влиянии на другие домены. Добавление RL к существующему math-эксперту - +13 пунктов.

Стоимость обновления одного домена масштабируется линейно, а не квадратично, как в монолитном пайплайне, где любое улучшение требует прогона всех доменов заново

Основа BAR - прогрессивное размораживание общих параметров по стадиям. На mid-training они остаются заморожены, а на этапе SFT размораживаются эмбеддинги и хэд: без этого эксперт не умеет вводить новые специальные токены (например, для вызова функций).

На RLVR размораживается всё, включая внимание. Каждый эксперт при этом учится на смеси доменных и общих SFT-данных: чистый доменный SFT ломает следование инструкциям и общие знания.

После обучения эксперты сливаются простым усреднением разошедшихся общих параметров, а роутер дообучается на стратифицированной 5%-й выборке SFT-данных.

Тестовая модель BAR-5x7B на основе Olmo 2 7B с экспертами по математике, коду, tool use и безопасности набирает 49.1 балла против 47.8 у монолитного переобучения на стадии посттрейна и 46.7 у BTX, где эксперты обучаются как полностью независимые плотные модели.

Ai2 выложил полный набор чекпоинтов, на которых валидировался метод: исходную 7B-модель как точку старта, базовый двухэкспертный MoE, а также промежуточные и финальные версии доменных экспертов - по математике и программированию в двух вариантах (после SFT и после SFT+RLVR), плюс экспертов по tool-use и безопасности, обученных только через SFT. Завершает набор итоговая пятиэкспертная MoE-модель с обученным роутером, объединяющая все домены.

📌Лицензирование: Apache 2.0 License.

🟡

Набор моделей

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Train #BAR #Ai2

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥57🤓32👍13👏12❤8💯5😁1

22K views11:10

Machinelearning

⚡️

27 миллиардов параметров, которые ставят на колени 397B
Команда Qwen снова любопытный показала фокус.

Их свежая модель Qwen3.6-27B это плотная, открытая и, что важнее, наглая. Она обгоняет собственного старшего брата Qwen3.5-397B-A17B почти во всех серьёзных бенчмарках по кодингу.

То есть модель в четырнадцать раз меньше по объёму бьёт флагмана. Вдумайтесь в эту арифметику, а потом посмотрите, сколько ваш ноутбук умеет держать в памяти.

Qwen3.6-27B заточена под агентный кодинг, то есть под сценарии, где модель не просто дописывает функцию, а сама планирует шаги, ходит по проекту, чинит баги и доводит задачу до рабочего состояния.

Плюс к этому вменяемое рассуждение в тексте и мультимодалке, два режима работы (с размышлением и без) и лицензия Apache 2.0. Никаких корпоративных оков, берёшь и пилишь своё.

Самое сочное в этой истории то, что локальный энтузиаст с одной приличной видеокартой теперь получает инструмент уровня того, за что ещё год назад просили API-ключ и подписку.

Blog: https://qwen.ai/blog?id=qwen3.6-27b
Qwen Studio: https://chat.qwen.ai/?models=qwen3.6-27b
Github: https://github.com/QwenLM/Qwen3.6
Hugging Face:
https://huggingface.co/Qwen/Qwen3.6-27B
https://huggingface.co/Qwen/Qwen3.6-27B-FP8
ModelScope:
https://modelscope.cn/models/Qwen/Qwen3.6-27B
https://modelscope.cn/models/Qwen/Qwen3.6-27B-FP8

@ai_machinelearning_big_data

#qwen

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👏126❤125🔥33🏆28👍14😁4🤩2

23.9K views13:19

Machinelearning

🌟

Boxer: модель для подъема 2D-детекций в 3D.

У WildDet3D от Института Аллена появился сосед по задаче: Reality Labs корпорации Марка Цукерберга опубликовала проект с той же целью - перевести 2D-детекции в 3D, но с иным профилем возможностей и открытости.

Boxer - более узкий, но геометрически более строгий инструмент для indoor-сценариев с трекингом и фузией.

Пайплайн трехступенчатый:

🟢детектор OWLv2 находит объекты в кадре;

🟢BoxerNet с DINOv3 под капотом через кросс-внимание поднимает каждую 2D-рамку в 3D, опираясь на внутренние параметры камеры, направление гравитации и глубину;

🟢детекции между кадрами либо сливаются офлайн через венгерский алгоритм, либо ведутся онлайн-трекером.

В отличие от WildDet3D, Boxer работает с видеопоследовательностями: ему нужны 6-DoF позы каждого кадра, гравитация и калибровка.

Взамен он дает то, чего у WildDet3D нет: согласованные сценовые 3D-боксы на уровне всей сцены и онлайн-трекинг с сохранением идентичности объектов.

Boxer поставляется как inference-решение: авторы не планируют выкладывать код обучения и оценки, объясняя это нежеланием тянуть долгосрочную поддержку.

В репозитории - только скрипты запуска и загрузчики датасетов Project Aria (Gen 1 и 2), CA-1M, SUN-RGBD и ScanNet.

Boxer запускается на macOS и Linux. Windows официально не поддерживается

📌Лицензирование: CC-BY-NC-4.0 License.

🟡

Страница проекта

🟡

Модель

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #CV #Detection #Boxer #RealityLabs

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔101🆒25👍22👌17❤13🔥5👏5

26K views16:10

✔️

Google анонсировала 8-е поколение TPU

Google и DeepMind разделили новую линейку тензорных процессоров на 2 чипа: TPU 8t для обучения и TPU 8i для инференса. Оба работают в связке с Arm-процессорами Google Axion. Причина разделения - рост агентных нагрузок, при которых универсальная архитектура проигрывает специализированной.

Суперпод TPU 8t содержит 9600 чипов, 2 ПБ HBM и выдаёт 121 экзафлопс пиковой производительности. Оптическая коммутация изолирует сбойные узлы без остановки кластера и держит goodput выше 97%.

TPU 8i заточен под инференс MoE-моделей с низкой задержкой. На борту 288 ГБ HBM и утроенный объём накристальной SRAM (384 МБ). Этого хватает, чтобы активный контекст модели лежал прямо на чипе, без обращений к внешней памяти. Новая топология межсоединений и жидкостное охлаждение дают 2х прирост энергоэффективности к прошлому поколению.
blog.google

✔️

Anthropic расследует утечку доступа к Mythos

Anthropic проверяет сообщение о несанкционированном доступе к Mythos через стороннего подрядчика. Доказательств того, что доступ распространился за пределы вендора, у компании пока нет. Триггером расследования стала публикация Bloomberg о том, что несколько человек делились доступом к модели.

Сообщество кибербезопасности оценивает Mythos двойственно: одни опасаются, что неконтролируемое распространение модели запустит волну атак, другие рассчитывают, что ограниченные релизы как раз дадут фору защитникам.

Это второй инцидент с утечкой у Anthropic за месяц - ранее в сеть утекли исходники Claude Code.
wsj.com

✔️

OpenAI создает компанию-интегратора DeployCo

Компания создаёт совместное предприятие с частными инвестфондами и вложит в него до $1.5 млрд, первый транш - $500 млн. Структура под рабочим названием DeployCo будет внедрять ИИ в портфельные компании фондов-партнёров. Контрольный пакет будет у OpenAI, руководить структурой будет бывший COO компании Брэд Лайткэп.

Цель DeployCo - сократить разрыв между тем, что умеют современные модели, и тем, что бизнес у себя внедрил. Сейчас узкое место в энтерпрайзе - не возможности моделей, а сложность их развёртывания на стороне заказчика. Собственный интегратор должен снять этот барьер и помочь OpenAI удерживать долю корпоративного рынка в конкуренции с Anthropic и другими игроками.
ft.com

✔️

Xiaomi открыла бету модели MiMo-V2.5-Pro

Новый флагман обучили под долгие агентные сценарии с множеством вызовов внешних инструментов без потери контекста. На демо модель написала компилятор на Rust за 4.3 часа и собрала десктопный видеоредактор на 8000 строк за 11.5 часов.

Отдельно Xiaomi выделяет автоматизацию проектирования аналоговых микросхем: задачи, на которые у инженеров уходят дни, модель закрывает за час. По бенчмаркам самой Xiaomi, MiMo-V2.5-Pro расходует на 40–60% меньше токенов, чем Opus 4.6, Gemini 3.1 Pro и GPT-5.4 на сопоставимых задачах.

На период тестирования доступ открыт по API. Исходники всей серии MiMo-V2.5 обещают открыть в ближайшее время. Попробовать модель можно в веб-студии.
mimo.xiaomi.com

✔️

Odyssey представил модель мира Odyssey-2 Max

Стартап, основанный выходцами из индустрии беспилотных автомобилей, выпустил вторую версию своей модели мира. Odyssey-2 Max построена на авторегрессионном DiT, который предсказывает кадр за кадром и реагирует на пользовательский ввод в реальном времени.

По параметрам модель в 3 раза больше предыдущей версии, по объёму обучающих данных - в 10 раз. На VBench 2 новинка обошла NVIDIA Cosmos-Predict2.5-14B по точности физических симуляций.

Доступ - в закрытой бете для партнёров из робототехники, геймдева, оборонки и интерактивных систем.
odyssey.ml

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍114🔥44❤27🤔13👏6⚡2🤩2

19.5K views05:47

Machinelearning

🌟

Google собрал механизм памяти, который учит ИИ-агентов на собственных ошибках

Агенты, которые управляют браузером или правят код, решают каждую задачу с нуля. Провалился - забыл. Получилось - тоже забыл. Google Research предложил фреймворк ReasoningBank, который даёт агенту память и позволяет учиться на ошибках, а не только на победах.

Предшественники (Synapse, AWM) запоминали только успешные прогоны. Когда им скормили провальные - стало хуже: AWM потерял 2,2% точности. ReasoningBank, в свою очередь, из успешной траектории он берёт валидированную стратегию, а из провальной - урок, что пошло не так.

🟡

Как это работает на практике

Агент получает задачу "найди дату первой покупки". Без системы памяти он заходит в "Последние заказы", видит свежий заказ и выдаёт неверный ответ.

С ReasoningBank - вспоминает стратегию из прошлого опыта: при поиске в истории проверяй все страницы, а не только первую. Переходит в полный список заказов, листает до конца и находит правильную дату.

Другой пример: задача "купи самый топовый товар из категории мужской обуви". Без памяти агент тратит 29 шагов, потому что не может найти фильтр по категории, а с памятью только 10, так как стратегия фильтрации уже в запасе.

🟡

Техническая структура

После каждой задачи та же языковая модель оценивает, удалась попытка или нет. Из траектории извлекаются записи (заголовок, описание, содержание), намеренно абстрагированные от конкретного сайта.

Перед новой задачей агент ищет похожие записи через эмбеддинг-поиск и получает их как часть промпта.

🟡

Поверх ReasoningBank построили MaTTS

Это метод (Memory-aware Test-Time Scaling) масштабирования вычислений на инференсе с учётом памяти.

Агент генерирует несколько попыток для одной задачи, сравнивает их между собой и выделяет устойчивые паттерны.

Получается цикл: хорошая память направляет попытки в перспективные области, а разнообразные попытки обогащают память.

🟡

Цифры

На WebArena ReasoningBank поднимает процент успеха на 8,3 п.п. с Gemini-2.5-flash и на 7,2 п.п. с Gemini-2.5-pro, сокращая число шагов до 16%.

На SWE-Bench-Verified resolve rate увеличился с 54% до 57,4%, при этом расход токенов больше всего на 4,3%.

Фреймворк работает и на маленьких моделях: на WebArena-Shopping даже Gemma-3-12B с ReasoningBank улучшает показатель с 17,1% до 24,1%.

🟡

Статья

🟡

Arxiv

🖥

Github

@ai_machinelearning_big_data

#AI #ML #Memory #Agents #ReasoningBank #Google

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤩107💯32🔥28❤24👍14🤓14👏8⚡1

21.8K views09:10

Machinelearning

✔️ Hunyuan выпустил превью Hy3 в опенсорсе: 295B параметров, 21B активных, контекст 256K.

Это гибридный MoE с режимами быстрого и медленного мышления, и первая модель после полной перестройки инфраструктуры предобучения и RL.

Агент тянет цепочки до 495 шагов в продакшене, работает с документами, аналитикой данных и MCP-инструментами.

По скорости инференса: время до первого токена сократили на 54%, полное время ответа - на 47%. При этом на живых задачах CodeBuddy и WorkBuddy модель падает меньше чем раз на десять тысяч запросов.

На стандартных бенчах (SWE-bench Verified для кода, Terminal-Bench 2.0 для терминала, BrowseComp и WideSearch для веб-поиска) Hy3 идёт вровень с топовыми кодинговыми и поисковыми агентами.

Совместима с OpenClaw, OpenCode и KiloCode, запускается через vLLM и SGLang.

🤖 https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview
💻 https://github.com/Tencent-Hunyuan/Hy3-preview

@ai_machinelearning_big_data

#Hunyuan

Please open Telegram to view this post

VIEW IN TELEGRAM

❤25👍20🔥8🥰1😁1

21.2K viewsedited 12:13

Machinelearning

1:10

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

OpenAI запустила в ChatGPT Workspace Agents

Workspace Agents - это новый формат ИИ-помощников внутри ChatGPT, ориентированный на корпоративные команды. Согласно описанию, такие агенты выполняют многошаговые задачи без постоянных подсказок и могут продолжать работу даже в отсутствие пользователя.

OpenAI позиционирует Workspace Agents как эволюцию кастомных GPTs: вместо инструмента для одного человека команда может создать общего агента, использовать его в ChatGPT и постепенно дорабатывать.

Типовые сценарии - подготовка отчётов, обработка заявок на закупку ПО, маршрутизация клиентских отзывов, рассылки и проверка контрагентов.

Доступ к Workspace Agents ограничен тарифами Business, Enterprise, Edu и Teachers. До 6 мая использование бесплатное, затем OpenAI включат тарификацию по кредитам.

Кастомные GPT, по словам OpenAI, продолжат работать. В дальнейшем компания обещает упростить их перевод в формат Workspace Agents.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍102👏27🤔17🎉9❤6🔥2👌2🆒1

20.4K views14:02

Machinelearning

МТС Web Services - трехкратный победитель CDO/CDTO Awards 2026.

🔥 22 апреля 2026 года на VII Российском саммите по цифровой трансформации объявили победителей премии CDO/CDTO Awards. MWS стала обладателем сразу трех наград.

🔘

«Digital‑платформа года» - MWS Cloud Platform

Публичная облачная платформа собственной разработки, экосистема инфраструктурных и платформенных сервисов для запуска и масштабирования цифровых продуктов любой сложности.

🔘

«Digital‑решение года» - MWS GPT

B2B‑платформа, которая объединяет около 90 больших языковых моделей для решения бизнес‑задач.

🔘

«CEO года цифровой компании» - Павел Воронин, генеральный директор MWS.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥69👏24🏆19👍11🤣11❤5🎉5🤔2🆒1

19.9K views15:06

Machinelearning

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Agibot Expedition A3 - это полноразмерный гуманоидный робот, который может складываться в собственный контейнер для хранения.

Он рассчитан на использование в домах, отелях и ритейле.

Цена - около $45 000.

@ai_machinelearning_big_data

🤔82😁42👍34👀14👏11🌭11❤6🤓4👨‍💻2🎅2😨1

19.5K views16:09

✔️

Китай испытывает стаи вооружённых робо-собак с координацией через ИИ.

Китайские военные провели испытания автономных четвероногих роботов, способных действовать скоординированными группами в условиях боевых действий.

Каждая машина передвигается со скоростью до 15 км/ч, несёт полезную нагрузку до 25 кг и преодолевает препятствия высотой до 30 см. За подвижность на неровном рельефе отвечают 12 независимых сочленений.

Роботы оснащены системами ИИ и обмениваются сенсорными данными в реальном времени, что позволяет стае действовать как единое целое.

Внутри группы роботы распределены по специализациям:

🟢Разведывательные Dark Shadow сканируют окружение, строят динамические карты и передают данные в командный центр;

🟢Ударные Blood-Stained используют эту информацию для наведения вооружения;

🟢Модели Extreme Land отвечают за логистическую поддержку группы.

Несмотря самостоятельность, финальную команду на открытие огня отдает человек-оператор.

Управлять машинами можно голосом или через специальные перчатки с датчиками, считывающими жесты рук. В сеть стаи также интегрированы дроны — это расширяет радиус действия и создает связку наземных и воздушных единиц для работы в сложных сценариях.

🟡

Дисклеймер:

Видеоматериал представляет собой постановочные военные учения. Ролик снят и распространён государственными СМИ Китая - Global Times и Shanghai Media Group.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔61🔥34👀19😨15💯11❤9👏6🤨4👨‍💻1🤝1

26.1K views18:10

Machinelearning

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 OpenAI представила GPT-5.5

Она заметно сильнее в самом главном: код, ресёрч, аналитика и работа с документами.

GPT 5.5 хороша в многоступенчатых задачах.

И почти во всём обходит конкурентов - например, на Terminal-Bench выбивает 82,7% против 69% у свежей Claude.
GPT-5.5 уже доступна пользователям Plus, Pro, Business и Enterprise - в ChatGPT и Codex.

Модель стала дороже: ~$5 / $30 за млн токенов.

Уже раскатывают на всех платных подписчиков.

Тестим! 🔥

https://openai.com/index/introducing-gpt-5-5/

🔥135❤25👏19🤩16🥱10👍6💯4🤣3🤨2

42.2K views18:16

Machinelearning

🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года.

Длинный контекст больше не фича для демо. Теперь это базовый уровень.

Пока Запад празднует релизы с пафосными стримами, китайцы из DeepSeek сегодня утром просто выложили в Hugging Face две открытые модели и пошли пить чай. А теперь весь твиттер пытается осознать, что произошло. V4-Pro на 1.6 триллиона параметров с 49 миллиардами активных и V4-Flash на 284 миллиарда с 13 активными. Обе открытые, обе с миллионом контекста по дефолту, обе уже доступны через API и на chat.deepseek.com.

Главная фишка даже не в размере, а в том, что DeepSeek пересобрали внимание. Они запихнули в модель токенную компрессию и свою DeepSeek Sparse Attention, за счёт чего длинный контекст стал буквально дешёвым.

Не «технически возможным за пять долларов за запрос», как у конкурентов, а реально дешёвым. 1М теперь стандарт во всех официальных сервисах, а не премиум-опция за отдельную плату.

По цифрам V4-Pro претендует на открытый SOTA в агентном кодинге, тащит математику и STEM и в общих знаниях уступает только Gemini 3.1 Pro. Flash-версия идёт следом почти вплотную по ризонингу и ровно держит планку Pro на простых агентных задачах, но с меньшей задержкой и смешным прайсом.

Отдельно интересно, что API теперь поддерживает и формат OpenAI ChatCompletions, и Anthropic, с переключением между Thinking и Non-Thinking режимами. Старые deepseek-chat и deepseek-reasoner отключат 24 июля 2026, так что у команд есть три месяца на миграцию.

И конечно, DeepSeek не забыли ткнуть Anthropic в бок: в треде прямо написано, что V4 «бесшовно интегрируется с Claude Code, OpenClaw и OpenCode». То есть пока у Anthropic вчера был пост-мортем про сломанный харнесс, DeepSeek сегодня предлагает подменить им модель и сэкономить.

Антропии и ОпенАи будут делать вид, что ничего не случилось, но стоимость миллиона токенов контекста только что стала суперлешевой, и от это уже не отмотаешь.

В релизе есть упоминания - «950 supernodes» это отсылка к Huawei Atlas 950 SuperPoD, новой инференс-инфраструктуре Huawei на чипах Ascend. DeepSeek говорят, что во второй половине 2026 года, когда эти суперноды запустят в масштабе, цена Pro заметно упадёт. То есть они планируют гонять инференс не на Nvidia, а на китайском железе Huawei.

Тариф Pro стоит $0.145 за вход и $3.48 за выход на миллион токенов.

Flash - $0.028 за вход и $0.28 за выход, что делает его неверятно дешевым для модели, которая заявляет уровень конкуренции с передовыми системами.

📄 Tech Report: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
🤗 Open Weights: https://huggingface.co/collections/deepseek-ai/deepseek-v4

@ai_machinelearning_big_data

#DeepSeek

1❤225👍80🔥64😁6

56.6K views04:40

About

Blog

Apps

Platform