Sber AI

Сбер на конференции ICLR 🏆

На крупнейшей мировой конференции по Data Science Сбер совместно с международными партнёрами представил MMTEB (Massive Multilingual Text Embedding Benchmark) — масштабный мультиязычный бенчмарк для оценки текстовых эмбеддеров.

Наши исследователи добавили в MMTEB русскоязычную часть — ruMTEB. Теперь можно полноценно и честно оценивать модели на русском языке 🔥

Кратко о ruMTEB в составе MMTEB:

🔘 7 категорий и 23 задания
🔘 Открытый код и датасеты на HuggingFace
🔘 Интеграция в международный бенчмарк MMTEB

Пожелаем коллегам ещё больше научных побед 🔥

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥2❤1

1.31K views16:34

Sber AI

Главные AI-тренды 2025

AI-технологии развиваются стремительно: появляются новые модели, формируются подходы к их обучению и применению. Способность моделей рассуждать растет невероятными темпами, а стоимость постепенно падает. Благодаря этому AI все чаще применяется в корпоративных и исследовательских задачах.

Что нас ждёт в ближайшие 5 лет? Это можно спрогнозировать по кривой Гартнера, которую также называют Hype Cycle. Рассказываем в карточках — от reasoning-моделей и локального fine-tuning до RAG-подходов и AI-агентов 👆

👍7❤1👏1

1.19K views07:59

Sber AI

Ваш бэкап AI-знаний: от микросервисов до составления резюме

🟢

Искусственный интеллект. Современный подход — это полноценное полевое руководство разработчика! Подойдёт как новичкам, так и опытным специалистам. Охватывает машинное обучение, NLP, мультиагентные системы и робототехнику. Алгоритмы даны в псевдокоде, а их реализации на Python, Java, Lisp и JavaScript доступны на GitHub

🟢

Создание микросервисов — книга рассматривает ключевые архитектурные принципы, API-интеграцию, CI/CD и тестирование. Идеально для бэкенд-специалистов, работающих с Docker, Kubernetes и облачными технологиями

🟢

Прикладное машинное обучение — полное руководство для AI-инженеров, которое включает регрессию, SVM, деревья решений, нейросети, CNN, трансформеры и GAN, с практическими примерами на Scikit-Learn, TensorFlow и Keras

🟢

Какого цвета Ваш парашют? — путеводитель по карьерному росту, проверенный временем. Научит подсвечивать ваши сильные стороны, выстраивать полезные связи и проходить собеседования. Внутри — практические упражнения, тактики нетворкинга и советы по составлению резюме

🟢

Карьера программиста — хотите попасть в FAANG? Книга содержит 189 задач по алгоритмам, структурам данных и анализу сложности Big O. Поможет подготовиться к техническим интервью в ведущие IT-компании

✅ Сохраните, чтобы не потерять!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🔥3

1.07K views08:25

Sber AI

Новый стандарт для NLP?

В марте вышла NeoBERT — модель, уже показавшая себя как state-of-the-art в задачах обработки естественного языка.
В отличие от генеративных моделей, энкодеры почти не развивались последние 5 лет. И, хотя архитектура и контекстное окно моделей вроде BERT и RoBERTa когда-то были революционными, за современными требованиями они не поспевают.

Что нового в NeoBERT:

🔍 Контекст в 4096 токенов (у BERT — 512): для энкодеров это прорыв;
🔍 Активация SwiGLU: быстрее и стабильнее GELU;
🔍 Относительные эмбеддинги RoPE: работают с длинными последовательностями лучше, чем старые абсолютные;
🔍 Нормализация Pre-RMSNorm: проще и надёжнее, чем LayerNorm.

Модель обучена на 2.8 ТБ текстов из интернета RefinedWeb — в 18 раз больше корпуса RoBERTa. Такой объём и разнообразие выборки делают NeoBERT значительно «умнее» на старте. На момент своего выхода она заняла первое место среди открытых энкодеров в большинстве задач бенчмарка MTEB (Massive Text Embedding Benchmark).

Почему это важно?

MTEB оценивает, насколько точно модель превращает текст в вектора — основу поиска, рекомендаций и многих чат-систем. Победа в MTEB = лучшая готовность к реальным задачам. Поэтому NeoBERT на первом месте — очень весомый аргумент для сообщества, чтобы начать использовать его для разработки LLM.

🔧 Подробнее о модели — тут, а попробовать её можно здесь.

❤3🔥3👍2

1.08K views12:15

Sber AI

Новые ассистенты, «периодическая таблица» для алгоритмов, AI в биомеде взлетает — собрали всё самое интересное 🤖

Видео и графика

1️⃣ В Adobe представили Firefly Image Model 4 с новыми AI-функциями. Сильно упростили настройки при генерации изображений и видео. Cтало проще менять стили, форматы и ракурсы. Создавать картинки можно даже в 2K. Новинки доступны в Photoshop, Premiere Pro и других продуктах компании.

Ассистенты и мультимодальные решения

2️⃣ Meta* запустила персонального AI-ассистента на базе LLaMa 4. Новый помощник Meta AI живёт в Facebook*, Instagram* и очках Ray-Ban Meta. Может общаться голосом, генерировать изображения и персональные ответы.

3️⃣ Виртуальный AI-агент получил награду за клиентский сервис. Продуктами 2025 года назвали Wave iX Translate и AI Virtual Agent от ibex. Они настраиваются под специфику конкретного бизнеса и полностью автоматизируют общение с клиентами.

Наука и медицина

4️⃣ Исследователи MIT разработали «периодическую таблицу» алгоритмов машинного обучения. Ученые составили уравнение, описывающее то, как 20 классических алгоритмов строят взаимосвязи в данных. И на основе этого уравнения классифицировали каждый из них. С помощью таблицы можно комбинировать методы и создавать новые модели.

5️⃣ Питтсбургский университет и Amazon Web Services открыли центр AI в спортивной аналитике. Студенты будут разрабатывать модели для предотвращения травм и анализа результатов спортсменов.

6️⃣ Китайские компании Anhui Conch Cement и Huawei создали AI-модель для производства цемента. В систему заложены более 200 сценариев, которые упрощают расчёты на всём производственном цикле: от карьера до доставки продукта клиенту.

Бизнес и инвестиции

7️⃣ Биомедицинские AI-проекты получат больше финансирования. Ожидается, что инвестиции в фарм-проекты с AI вырастут с $4 миллиардов в 2025 году до $25 миллиардов к 2030 году.

* экстремистские организации, деятельность которых запрещена на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🔥4👏2

1.03K views15:00

Sber AI

Сбер на научной конференции NAACL'25 🔥

В Нью-Мексико прошла NAACL’25 — одна из главных NLP-конференций. В этом году было подано 3 246 научных работ, из которых одобрили лишь 719 (22,15%). И работа исследователей из Сбера среди них! 🏆

На конференции наша коллега Мария Тихонова представила исследование команд AGI NLP и RnD для B2C: "The Russian-focused embedders’ exploration: ruMTEB benchmark and Russian embedding model design".

Это продолжение нашей работы над эмбеддингами текстов, которую они ранее представили на ICLR. В рамках нового исследования для NAACL коллеги обучили ru-en-RoSBERTA — модель для русскоязычных текстов — и испытали её в бенчмарке ruMTEB. В нем модель показала отличные результаты на уровне своих основных конкурентов.

Ожидаем, что очень скоро поддержка русского языка в LLM выйдет на принципиально новый уровень ⚡️

Ставьте 👏 и присоединяйтесь к пожеланиям успеха команде!

Please open Telegram to view this post

VIEW IN TELEGRAM

👏8👍3💔1

1.2K views11:46

Sber AI

DeepSeek выпустила Prover V2 — LLM на 671 млрд параметров для решения математических и логических задач 🔄

Что в основе:

⚫️ Язык программирования Lean4
⚫️ 8 млрд синтетических примеров от DeepSeek V3
⚫️ RL-обучение с обратной связью «верно/неверно»

💡 Есть облегчённая версия Prover V2 7b с расширенным контекстом до 32 000 токенов (в предыдущей было всего 4 000).

📊 Модель прошла бенчмарк ProverBench из 325 задач по алгебре, теории чисел и комплексному анализу, в том числе из соревнований AIME 24 и 25. А в тесте MiniF2F, состоящем из олимпиад для студентов и старшеклассников, показала 88,9% точности. Такого результата модель достигает благодаря масштабной архитектуре и узкой специализации на доказательствах в различных разделах математики. Имеет ли Prover V2 шансы стать популярной в автоматизации математических расчётов? Будем тестировать ☑️

➡️ Подробнее на GitHub.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🤔4

1.36K views10:40

Sber AI

Продолжаем разбирать AI-тренды 2025 года

В первой части трендов мы говорили о reasoning-моделях, RAG и локальном fine-tuning. А теперь посмотрим, как AI выходит за пределы чатов в науку, кино и квантовый мир.

Сохраняйте карточки, чтобы не потерять ✔️

Как вам такой прогноз?
👍 — посмотрим, что из этого выйдет
🔥 — такое будущее мы хотим

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥2

1.2K views08:03

About

Blog

Apps

Platform