Какие планы на 19 ноября?
ML-инженеры, дата-аналитики и все, кто работает с машинным обучением, бронируйте вечерний слот в календарях, потому что команда Купер.тех зовет вас на митап в Москве и онлайн.
В программе:
🟢 Первый шаг к векторному поиску
Игорь Самарин, Machine Learning Engineer в Купер.тех
🟢 Применение LLM в поиске для разметок
Александр Баранов, Data Analyst в Купер.тех
🟢 Как картинки находят себе пары
Николай Чугунников, Senior Machine Learning Engineer в Купер.тех
🟢 От интуиции к алгоритмам: data-driven подход к массовому найму
Вадим Грошев, Machine Learning Engineer в Купер.тех
Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию.
Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFGdhm9a
ML-инженеры, дата-аналитики и все, кто работает с машинным обучением, бронируйте вечерний слот в календарях, потому что команда Купер.тех зовет вас на митап в Москве и онлайн.
В программе:
🟢 Первый шаг к векторному поиску
Игорь Самарин, Machine Learning Engineer в Купер.тех
🟢 Применение LLM в поиске для разметок
Александр Баранов, Data Analyst в Купер.тех
🟢 Как картинки находят себе пары
Николай Чугунников, Senior Machine Learning Engineer в Купер.тех
🟢 От интуиции к алгоритмам: data-driven подход к массовому найму
Вадим Грошев, Machine Learning Engineer в Купер.тех
Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию.
Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFGdhm9a
❤1🔥1
📝🚀 Kimi Writing Agent: Автономный писатель для создания книг и рассказов
Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.
🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- ⚡ Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени
📌 GitHub: https://github.com/Doriandarko/kimi-writer
#python
Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.
🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- ⚡ Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени
📌 GitHub: https://github.com/Doriandarko/kimi-writer
#python
GitHub
GitHub - Doriandarko/kimi-writer: AI writing agent powered by kimi-k2-thinking - autonomously creates novels and stories with deep…
AI writing agent powered by kimi-k2-thinking - autonomously creates novels and stories with deep reasoning - Doriandarko/kimi-writer
❤4🔥1
Смотришь вакансии AI/LLM Engineer. Часто видишь:
✅ Опыт с LangChain
✅ RAG-системы и векторный поиск
✅ Агенты и tool-calling
✅ Промпт-инжиниринг и работа с LLM API
В резюме этого нет? Дальше не смотрят.
Курс «LangChain: с нуля до продакшн» покрывает эти навыки:
→ LangChain на практике (цепочки, агенты, инструменты)
→ RAG с метриками качества (precision/recall, faithfulness)
→ Tool-calling и агенты (веб-поиск, Pandas-аналитика)
→ Продакшн-контур: FastAPI, observability, PromptOps
Проект в GitHub + сертификат = можешь писать в резюме "опыт с LangChain, RAG, агентами".
Скидка 25% — 72 часа.
Начать со скидкой
✅ Опыт с LangChain
✅ RAG-системы и векторный поиск
✅ Агенты и tool-calling
✅ Промпт-инжиниринг и работа с LLM API
В резюме этого нет? Дальше не смотрят.
Курс «LangChain: с нуля до продакшн» покрывает эти навыки:
→ LangChain на практике (цепочки, агенты, инструменты)
→ RAG с метриками качества (precision/recall, faithfulness)
→ Tool-calling и агенты (веб-поиск, Pandas-аналитика)
→ Продакшн-контур: FastAPI, observability, PromptOps
Проект в GitHub + сертификат = можешь писать в резюме "опыт с LangChain, RAG, агентами".
Скидка 25% — 72 часа.
Начать со скидкой
❤2
🚀 **VibeThinker-1.5B** - модель, которая ломает миф «больше параметров = умнее».
Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)
💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.
🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.
🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)
💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.
🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.
🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
👍2
# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал
Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.
Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.
💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.
🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.
🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.
> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.
Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.
💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.
🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.
🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.
> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
❤4🔥4
🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?
Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.
🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.
Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.
В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.
Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.
📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤1🤡1
🎮 Погружение в мир AI-социума
Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.
🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами
📌 GitHub: https://github.com/KsanaDock/Microverse
#gdscript
Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.
🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами
📌 GitHub: https://github.com/KsanaDock/Microverse
#gdscript
🤖 Claude Code Infrastructure Showcase
Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.
🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена
📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase
#typescript
Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.
🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена
📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase
#typescript
GitHub
GitHub - diet103/claude-code-infrastructure-showcase: Examples of my Claude Code infrastructure with skill auto-activation, hooks…
Examples of my Claude Code infrastructure with skill auto-activation, hooks, and agents - diet103/claude-code-infrastructure-showcase
❤1
Что посмотрим и обсудим:
Регистрация обязательна — количество мест ограничено!
Реклама. ИП Чичерин-Лукьяненко Андрей Игоревич. ИНН 772830905927. erid: 2VtzqvLYND7
Please open Telegram to view this post
VIEW IN TELEGRAM
XLTable - OLAP Cервер для нового стека данных
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.
Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.
📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке
🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов
⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования
Хочешь получить бесплатную пробную версию на 30 дней?
👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой
Контакт: https://t.iss.one/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.
Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.
📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке
🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов
⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования
Хочешь получить бесплатную пробную версию на 30 дней?
👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой
Контакт: https://t.iss.one/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/
🔥8❤7👍4
🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей
Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.
📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков
🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.
🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)
💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.
Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.
https://www.alphaxiv.org/abs/2511.02864v1
Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.
📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков
🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.
🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)
💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.
Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.
https://www.alphaxiv.org/abs/2511.02864v1
👍5🔥1
Пилот с ИИ успешен, но масштабировать не получается?
«Технология работает, но устойчивого бизнес-эффекта нет. А вокруг – один хайп, сложно найти реально рабочие схемы».
Именно такие вопросы мы разбираем в AI Inside – канале о практическом применении ИИ в бизнесе.
Здесь нет абстрактных теорий – только то, что работает на практике:
• Разбираем реальные кейсы: с цифрами и измеримыми результатами.
• Делимся методиками внедрения: от автоматизации процессов до оркестрации ИИ-агентов.
• Даем экспертный анализ: сложные темы – без воды, с фокусом на практической пользе.
О чем пишем в канале уже сейчас:
• Почему ИИ-агенты (пока) не заменят ваших сотрудников
• 95% компаний не получают отдачи от инвестиций в GenAI – это правда?
• Какие навыки команды будут критичны в 2030 году (спойлер: не программирование)
А еще:
изучаем техтренды и идеи, которые можно применить уже сегодня. Делимся инсайтами от инженеров-практиков и подборками классных статей про нейросети. И смешно шутим на тему ИИ.
Если вам интересен практический взгляд на ИИ – подписывайтесь → AI Inside
«Технология работает, но устойчивого бизнес-эффекта нет. А вокруг – один хайп, сложно найти реально рабочие схемы».
Именно такие вопросы мы разбираем в AI Inside – канале о практическом применении ИИ в бизнесе.
Здесь нет абстрактных теорий – только то, что работает на практике:
• Разбираем реальные кейсы: с цифрами и измеримыми результатами.
• Делимся методиками внедрения: от автоматизации процессов до оркестрации ИИ-агентов.
• Даем экспертный анализ: сложные темы – без воды, с фокусом на практической пользе.
О чем пишем в канале уже сейчас:
• Почему ИИ-агенты (пока) не заменят ваших сотрудников
• 95% компаний не получают отдачи от инвестиций в GenAI – это правда?
• Какие навыки команды будут критичны в 2030 году (спойлер: не программирование)
А еще:
изучаем техтренды и идеи, которые можно применить уже сегодня. Делимся инсайтами от инженеров-практиков и подборками классных статей про нейросети. И смешно шутим на тему ИИ.
Если вам интересен практический взгляд на ИИ – подписывайтесь → AI Inside
👍2👎2🔥2👌2
TextOp - фреймворк для управления гуманоидными роботами с помощью текста в реальном времени.
🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.
🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.
Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.
https://text-op.github.io
🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.
🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.
Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.
https://text-op.github.io
🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?
Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.
🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.
Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.
В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.
Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.
📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
LoRA-модель для Qwen-Image-Edit-2509, которая автоматически:
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу
Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.
Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу
Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.
Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
❤2
Cloud.ru перевел Evolution AI Factory в коммерческую эксплуатацию. Теперь компании любого масштаба могут быстро запускать AI-решения, работать с генеративными моделями и экспериментировать с гипотезами.
Среда для разработки и внедрения решений на базе GenAI работает по тарифам с SLA, круглосуточной поддержкой и возможностью масштабирования, а цены на большие языковые модели составляют в среднем 35 ₽ за входной и 70 ₽ за выходной миллион токенов.
📈 Ключевые возможности и сервисы Evolution AI Factory:
• Доступ к каталогу Foundation Models (20+ моделей, включая GigaChat, Qwen, ChatGPT)
• Быстрый запуск моделей через ML Inference, включая свои и сторонние с HuggingFace• Эксперименты и тестирование гипотез в Evolution Notebooks
• Дообучение моделей под задачи бизнеса через ML Finetuning
• Работа с корпоративными данными и повышение точности через Managed RAG
• Запуск автономных AI Agents, выполняющих задачи и принимающих решения
Среда для разработки и внедрения решений на базе GenAI работает по тарифам с SLA, круглосуточной поддержкой и возможностью масштабирования, а цены на большие языковые модели составляют в среднем 35 ₽ за входной и 70 ₽ за выходной миллион токенов.
📈 Ключевые возможности и сервисы Evolution AI Factory:
• Доступ к каталогу Foundation Models (20+ моделей, включая GigaChat, Qwen, ChatGPT)
• Быстрый запуск моделей через ML Inference, включая свои и сторонние с HuggingFace• Эксперименты и тестирование гипотез в Evolution Notebooks
• Дообучение моделей под задачи бизнеса через ML Finetuning
• Работа с корпоративными данными и повышение точности через Managed RAG
• Запуск автономных AI Agents, выполняющих задачи и принимающих решения
💩2👍1
🚀 Оптимизация нагрузки с LPLB для MoE моделей
LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.
🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.
📌 GitHub: https://github.com/deepseek-ai/LPLB
#python
LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.
🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.
📌 GitHub: https://github.com/deepseek-ai/LPLB
#python
GitHub
GitHub - deepseek-ai/LPLB: An early research stage MoE load balancer based on inear programming.
An early research stage MoE load balancer based on inear programming. - deepseek-ai/LPLB