Sber AI
6.54K subscribers
2.15K photos
577 videos
1 file
1.94K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Как научить роботов думать и действовать 🤖

Благодаря достижениям в Embodied AI роботы планируют, рассуждают и ориентируются в незнакомой обстановке — то есть становятся самостоятельными агентами. В карточках объясняем, какие технологии и модели помогают роботам совершенствовать навыки ⬆️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💯7👍3👏21
Как создать агента с нуля 🔥

Давно хотите создать агента для своих задач, но не знаете как? У команды GigaChain есть решение. Разработчики опубликовали пошаговый гайд по созданию ReAct-агентов с помощью фреймворка LangGraph.

Что такое ReAct

ReAct — это паттерн поведения LLM-агентов, при котором пошаговые рассуждения чередуются с наблюдениями и действиями. Это позволяет агенту работать автономно. Для этого современные агенты подключают внешние инструменты. Модель выдаёт запрос в виде JSON-объекта. А фреймворк в основе агента вызывает соответствующую функцию в коде.

«Академическая работа ReAct: Synergizing Reasoning and Acting in Language Models создавалась, когда LLM были сильно глупее и не умели вызывать тулзы. Реализация подхода в оригинальной статье и в актуальных фреймворках для разработки агентов существенно различается. И этот момент особо не подсвечивается в материалах ни на русском, ни на английском языке», — пишет Сергей Тращенков из команды GigaChain

Чем примечателен LangGraph

LangGraph позволяет создавать сложных агентов с памятью и восприятием контекста, а также мультиагентные системы. Он собирает процессы с параллельными ветками задач в граф с циклами. Получается интерпретируемая схема. В отличие от агентов, построенных на базе другой популярной библиотеки — LangChain, такую структуру легко настраивать и расширять.

Из гайда вы узнаете:

🔘 как ReAct-агенты перешли от парсинга текста к tool calling
🔘 чем отличаются LangGraph и LangChain и для каких задач они подходят
🔘 как собрать агента с нуля
🔘 как настроить вызов инструментов, память и поиск — в гайде есть пример готового кода

Читайте материал по этой ссылке и быстрее пробуйте!
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍8🔥5👏1🤔1
Мы часто сталкиваемся с забавными ошибками нейросетей. Как думаете, о какой проблеме машинного обучения идёт речь на картинке?
👍5😁3🤔32
2🔥2🤔2
Sber AI
Что обсуждают робохудожники?
Правильный ответ: проблема пальцев 🖐

Иногда диффузионные модели «рисуют» шестипалые руки. Они работают на уровне пикселей и вероятностей, без представления об анатомии или законах физики. Не зная, сколько пальцев у человека, они генерируют наиболее вероятные паттерны пикселей, похожие на кисть.

Чтобы решить проблему, можно дообучить модели на размеченных данных, поделить процесс диффузии на этапы для постепенной детализации, добавить возможность постобработки или автоматически уточнить промпты с помощью Reasoning LLM.

Неправильные ответы

Композиция моделей — это не проблема, а метод машинного обучения. Согласно ему, несколько алгоритмов объединяют для улучшения качества прогнозов и обработки данных.

Image inpainting — это AI-технология, предназначенная для восстановления повреждённых участков изображения.

❤️ — если ответили верно
9😁3👍2💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Первый в мире робот-барабанщик 🔥

Гуманоидный робот G1 от Unitree исполняет рок, метал и джаз с точностью попадания в ритм 90%. Международная команда специалистов научила его этому с помощью AI-системы Robot Drummer. В её основе — многослойные перцептроны (нейросеть из трёх слоёв).

Что умеет робот

Он научился почти как человек менять палочки, играть со скрещёнными руками и корректировать силу удара в ответ на изменения темпа и динамики в песнях. Разработчики утверждают, что добились пространственной координации и 90% точности ритма.

Как модель училась барабанить

На основе MIDI-транскрипций песен разработчики составили для робота ритмические цепочки контактных событий (RCC). Они подсказывали ему, когда и по каким барабанам нужно ударить. Удары закодировали в виде векторов. Робот практиковался в виртуальной среде Isaac Gym с использованием обучения с подкреплением.

Создатели Robot Drummer планируют обучить робота импровизации и посадить его за настоящие барабаны.

Читайте статью и слушайте хиты в исполнении робота по этой ссылке.

🔥 — если ждёте, когда барабанщик соберёт робогруппу
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍52😁2🤔2
Про умные 3D-миры и дешёвую разметку данных — в нашем дайджесте 🤖

Инструменты


🥺 AIRI и МФТИ создали 3DGraphLLM — метод для LLM при работе с 3D-пространством. Он учитывает пространственные и смысловые связи объектов внутри помещения, что позволяет нейросети точнее распознавать детали на изображениях сложных интерьеров. Модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.

🔗 Учёные СГУ выяснили: два связанных биологических нейрона меняют режим работы в зависимости от силы взаимодействия и внешнего тока. Они могут «молчать», передавать единичные импульсы или генерировать непрерывную серию сигналов. Открытие поможет в моделировании AI, нейроинтерфейсов и спайковых моделей.

📊 R&D-центр «Т-Технологий» с AIRI, ВШЭ, «Иннополисом» и Сбером создали ATGen — первый комплексный фреймворк, который использует парадигму активного обучения. Модель на каждом этапе сама выбирает нужные примеры для максимального роста точности. Это позволяет сократить расходы на сбор и разметку данных в три раза.

Модели

🌎 Google DeepMind представила Genie 3 — AI-модель, создающую 3D-миры в реальном времени. Теперь нейросеть может сохранять изображение в памяти в течение одной минуты — против 10–20 секунд в прошлой версии.

🧑‍💻 Anthropic выпустила Claude Opus 4.1 — обновлённую версию сервиса для агентских задач. Модель набрала 74,5% на SWE-bench Verified (производительность), стала точнее в рефакторинге и отладке кода.

📹 Tencent Hunyuan разработала Large-Vision — мультимодальную модель с 52 миллиардами активных параметров в архитектуре MoE. Она обрабатывает изображения любой чёткости, видео и 3D, поддерживает мультиязычность и подходит для AR/VR, 3D-моделирования и видеоаналитики.

👍 — хотели бы побродить по мирам Genie 3?
🔥 — больше электричества вам в нейроны
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🔥2💯1
Главные события big tech night в Сбере 🔥

Ночь больших технологий всё ближе! 12 сентября крупные компании одновременно откроют двери офисов ночью и покажут, где рождаются технологии.

В карточках собрали темы топовых докладов, которые прозвучат на площадке Сбера ⬆️

Также в программе много активностей:
🔘 квест, который познакомит с командами, продуктами и технологиями компании
🔘 IT-кэмп, где можно погрузиться в процессы и обсудить реальные кейсы
🔘 мастермайнды от ML-инженеров и продуктовых лидов
🔘 вечернее шоу «Что было в Сбере?» с невыдуманными историями
🔘 алгоритмическая вечеринка и шахматная мастерская


💻 Регистрируйтесь по этой ссылке — присоединиться можно как офлайн, так и онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍8👏51🤔1
+170% скорости генерации без костылей 🔝

Наши специалисты предложили новый механизм внимания NABLA для диффузионных трансформеров. Он позволяет снизить вычислительную нагрузку при сохранении качества генерации видео за счёт использования поблочного внимания, которое динамически адаптируется к разрежённости в трансформерах.

1️⃣ Вместо полного вычисления маски внимания (Full Attention) NABLA использует блочно-разрежённое внимание
2️⃣ Модель сжимает матрицы Query и Key, выделяя наиболее важные блоки с помощью кумулятивной функции распределения Softmax
3️⃣ Важными считаются те блоки, сумма которых превышает адаптивный порог 1−thr (алгоритмический параметр)
4️⃣ Вычисления выполняются только для наиболее значимых блоков


Результат: ускорение генерации модели Wan 2.1-14B в 2,7 раза (оценка CLIP, оценка VBench, оценка людей).

Метод работает без написания дополнительных CUDA-ядер и полностью совместим с Flex Attention из PyTorch ⚡️

➡️ Читайте статью на Hugging Face.

❤️ — Full Attention уходит, скорость остаётся
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3👏2🔥1
Уже планируете осень? 3 сентября — дата, которую стоит обвести красным 🚨

GoCloud Tech 2025 — конференция, где соберутся все, кто работает с AI. Четыре трека, десятки экспертов, воркшопы, демо, мерч и afterparty. Подробности — здесь 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3
Forwarded from Cloud.ru
Целый трек про AI&ML

AI-помощник в облаке, RAG, агенты, мультиагентные системы...

➡️ Это и многое другое будем обсуждать на нашей IT-конференции GoCloud Tech.

Где и когда:
😶‍🌫️3 сентября, Москва, Гоэлро Лофт
😶‍🌫️Для трека AI&ML будет доступна трансляция в VK, а еще будем вести репортаж на Twitch

Регистрируйтесь, чтобы ничего не пропустить🖱
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52