AI4Dev — AI for Development

Live stream started

11:03

Live stream finished (1 hour)

12:59

2025ый год только начался, а за последние три дня произошло два очень существенных события в индустрии LLM, которые собираются в одну картинку.

1. Вышла модель китайской компании DeepSeek R1. Если еще в июне 24го мы писали, что модель от DeepSeek в узких областях (например кодинг по некоторым бенчмаркам) приближается к ведущим производителям типа Mistral, то сегодня DeepSeek (судя по анонсированным бенчмаркам) уже не уступает общей ведущей модели o1 от OpenAI, при этом стоит в разы меньше и даже выложена в открытый доступ! Тут можно попробовать (нажимайте на кнопку Deep Think).

2. Словно ответ на DeepSeek сегодня Трамп объявил о создании в в США Stargate – инвестиционного проекта в 500 миллиардов долларов по созданию инфраструктуры для искусственного интеллекта. Партнером от мира ИИ в Stargate является Open AI.

Что это значит для разработки? Гонка не только не останавливается, но наоборот ускоряется, впереди нас ждут все более умные модели, которые смогут еще больше. Определенно пора учиться использовать ИИ в работе, если вы еще не начинали.

Китайские модели начали показывать очень достойные результаты, при этом они Open Source и есть уменьшенные (distilled) версии, которые можно запустить на разумном объеме железа. Проектировать закрытые решения для бизнеса на базе QWEN и DeepSeek видимо было хорошей идеей - их качество стремительно улучшается, а модели пока продолжают выкладывать в открытый доступ.

Мы снова видим, как меняются лидеры в отрасли, но в этот раз похоже уже наметились претенденты на топ-позиции. Вопрос вычислительных мощностей является ключевым и его не компенсировать даже гениальными алгоритмами или идеями. То что Google и Anthropic не позвали в Stargate – кажется тревожный для них звоночек (не говоря уже о европейских Mistral и других производителях). Например, российским решениям вроде GigaChat и YandexGPT вряд ли удастся побороться за лидерство: $500 млрд — это сравнимо со стоимостью всего Сбербанка или 50 «Яндексов». Впрочем остаются нишевые задачи: дообучение компактных моделей для специализированных целей — кажется все еще трендомом, где найдётся место многим игрокам.

PS
Пока писал этот пост вышла новость, что на этой неделе OpenAI выпустят Operator - ИИ приложение агента, которое может выполнять за вас работу за компьютером, двигать мышкой, открывать окна, вбивать информацию в формы и т.д. при этом самостоятельно выполняя заранее заданную цель. Где-то занервничали создатели RPA-платформ.

👍5🔥5🌚1

2.56K viewsAndrey S., 16:33