Big Data AI
17K subscribers
926 photos
118 videos
19 files
930 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Какие планы на 19 ноября?

ML-инженеры, дата-аналитики и все, кто работает с машинным обучением, бронируйте вечерний слот в календарях, потому что команда Купер.тех зовет вас на митап в Москве и онлайн.

В программе:

🟢 Первый шаг к векторному поиску

Игорь Самарин, Machine Learning Engineer в Купер.тех

🟢 Применение LLM в поиске для разметок

Александр Баранов, Data Analyst в Купер.тех

🟢 Как картинки находят себе пары

Николай Чугунников, Senior Machine Learning Engineer в Купер.тех

🟢 От интуиции к алгоритмам: data-driven подход к массовому найму

Вадим Грошев, Machine Learning Engineer в Купер.тех

Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию.

Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFGdhm9a
1🔥1
📝🚀 Kimi Writing Agent: Автономный писатель для создания книг и рассказов

Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.

🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени

📌 GitHub: https://github.com/Doriandarko/kimi-writer

#python
4🔥1
Смотришь вакансии AI/LLM Engineer. Часто видишь:
Опыт с LangChain
RAG-системы и векторный поиск
Агенты и tool-calling
Промпт-инжиниринг и работа с LLM API

В резюме этого нет? Дальше не смотрят.

Курс «LangChain: с нуля до продакшн» покрывает эти навыки:
LangChain на практике (цепочки, агенты, инструменты)
RAG с метриками качества (precision/recall, faithfulness)
Tool-calling и агенты (веб-поиск, Pandas-аналитика)
Продакшн-контур: FastAPI, observability, PromptOps
Проект в GitHub + сертификат = можешь писать в резюме "опыт с LangChain, RAG, агентами".

Скидка 25% — 72 часа.

Начать со скидкой
2
🚀 **VibeThinker-1.5B** - модель, которая ломает миф «больше параметров = умнее».

Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)

💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.

🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.

🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
👍2
# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал

Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.

Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.

💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.

🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.

🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.

> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
4🔥4
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31🤡1
🎮 Погружение в мир AI-социума

Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.

🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами

📌 GitHub: https://github.com/KsanaDock/Microverse

#gdscript
🤖 Claude Code Infrastructure Showcase

Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.

🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена

📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase

#typescript
1
🔥 Как аналитика данных трансформирует промышленное планирование — опыт лидеров отрасли

⚡️ Приглашаем 18 ноября (10:00–13:00, Москва) на отраслевое событие FanRuan о практическом применении аналитики в производстве. Разберем реальные кейсы, технологии прогнозирования и инструменты для принятия решений, чтобы планирование стало точнее, а загрузка мощностей — сбалансированной.
Что посмотрим и обсудим:

НЛМК (Роман Кулеш) — аналитика производственных планов, контроль выполнения Plan/Fact и архитектура BI для планирования;
ММК (Сергей Кулагин) — как визуализация ускоряет поиск узких мест и помогает принимать решения;
FanRuan (Zayne Zhao) — практический подход к прогнозированию спроса: от классификации спроса до связи плана с исполнением, и демонстрация возможностей продуктов FanRuan.

❗️ Для кого будет полезно: руководители и специалисты производств, аналитики и планировщики, ИТ и бизнес-подразделения, отвечающие за аналитику и цифровизацию.

❗️ Почему стоит прийти: реальные кейсы от лидеров металлургии и практические подходы к внедрению прогнозов на основе ИИ — без теории, только рабочие инструменты и примеры внедрения.

Регистрация обязательна — количество мест ограничено!

Реклама. ИП Чичерин-Лукьяненко Андрей Игоревич. ИНН 772830905927. erid: 2VtzqvLYND7
Please open Telegram to view this post
VIEW IN TELEGRAM
XLTable - OLAP Cервер для нового стека данных
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.

Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.

📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке

🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов

⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования

Хочешь получить бесплатную пробную версию на 30 дней?

👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой

Контакт: https://t.iss.one/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/
🔥87👍4
🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей

Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.

📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков

🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.

🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)

💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.

Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.

https://www.alphaxiv.org/abs/2511.02864v1
👍5🔥1
Пилот с ИИ успешен, но масштабировать не получается?

«Технология работает, но устойчивого бизнес-эффекта нет. А вокруг – один хайп, сложно найти реально рабочие схемы».

Именно такие вопросы мы разбираем в AI Inside – канале о практическом применении ИИ в бизнесе.

Здесь нет абстрактных теорий – только то, что работает на практике:

Разбираем реальные кейсы: с цифрами и измеримыми результатами.
Делимся методиками внедрения: от автоматизации процессов до оркестрации ИИ-агентов.
Даем экспертный анализ: сложные темы – без воды, с фокусом на практической пользе.

О чем пишем в канале уже сейчас:

• Почему ИИ-агенты (пока) не заменят ваших сотрудников
• 95% компаний не получают отдачи от инвестиций в GenAI – это правда?
• Какие навыки команды будут критичны в 2030 году (спойлер: не программирование)

А еще:

изучаем техтренды и идеи, которые можно применить уже сегодня. Делимся инсайтами от инженеров-практиков и подборками классных статей про нейросети. И смешно шутим на тему ИИ.

Если вам интересен практический взгляд на ИИ – подписывайтесь → AI Inside
👍2👎2🔥2👌2
TextOp - фреймворк для управления гуманоидными роботами с помощью текста в реальном времени.

🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.

🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.

Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.

https://text-op.github.io
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
LoRA-модель для Qwen-Image-Edit-2509, которая автоматически:
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу

Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.

Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
2
Cloud.​ru перевел Evolution AI Factory в коммерческую эксплуатацию. Теперь компании любого масштаба могут быстро запускать AI-решения, работать с генеративными моделями и экспериментировать с гипотезами.

Среда для разработки и внедрения решений на базе GenAI работает по тарифам с SLA, круглосуточной поддержкой и возможностью масштабирования, а цены на большие языковые модели составляют в среднем 35 ₽ за входной и 70 ₽ за выходной миллион токенов.

📈 Ключевые возможности и сервисы Evolution AI Factory:
• Доступ к каталогу Foundation Models (20+ моделей, включая GigaChat, Qwen, ChatGPT)
• Быстрый запуск моделей через ML Inference, включая свои и сторонние с HuggingFace• Эксперименты и тестирование гипотез в Evolution Notebooks
• Дообучение моделей под задачи бизнеса через ML Finetuning
• Работа с корпоративными данными и повышение точности через Managed RAG
• Запуск автономных AI Agents, выполняющих задачи и принимающих решения
💩2👍1
🚀 Оптимизация нагрузки с LPLB для MoE моделей

LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.

🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.

📌 GitHub: https://github.com/deepseek-ai/LPLB

#python