Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
⚡️ Оценка и приоритизация AI-проектов

AI-3P помогает заранее выявить риски и определить готовность компании по трём ключевым направлениям:
People, Processes, Product.

💡 Ключевая идея

Большинство AI-инициатив терпят неудачу не из-за технологий, а из-за проблем с внедрением — отсутствием владельцев, слабой интеграцией в процессы и неготовностью пользователей.

AI-3P превращает эти «слепые зоны» в количественную оценку готовности, помогая решать: строить, тестировать или доработать.

Как работает фреймворк:
1. Оцениваете проект по 3 столпам (People, Process, Product) через кастомные вопросы BYOQ (Bring Your Own Questions).
2. Каждому ответу присваивается балл:
 No/Unknown = 0
 Partial = 1
 Yes/NA = 2
3. Рассчитывается итоговый AI-3P Readiness Score (0–100)
 80–100 — Build now
 60–79 — Pilot with guardrails
 0–59 — De-risk first

🔗 Репозиторий с шаблоном

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍2
📘 На Stepik вышел курс — «LangChain: с нуля до продакшн LLM-приложений»

Нужен не игрушечный бот, а воспроизводимый RAG-пайплайн с метриками и сервисом? Этот курс — про путь «ноутбук → FastAPI → прод».

🔍 Что вы получите
• RAG по PDF с цитированием источников и гибридным поиском (BM25 + вектор + rerank); контроль галлюцинаций через метрики (precision/recall@K, citation-rate)
• Инструменты и агенты для анализа данных: Pandas-задачи, структурированный JSON-вывод под отчёты/дашборды
• Продакшн-контур: FastAPI-сервис, логирование латентности/токенов, PromptOps (версии/A/B), базовый SLA-мониторинг

🎓 Сертификат по завершении — можно добавить в резюме или LinkedIn

🚀 Начните сегодня и получите скидку 25% в течение 72 часов

👉 Пройти курс на Stepik


Реклама. ИП Малышкин Алексей Андреевич, ИНН 402571325199. Erid 2VtzquyQ9cs
😁3🙏2
📘 Определение дня: Hypernetwork (гиперсеть)

Hypernetworks — это нейросети, которые генерируют веса для другой нейросети.
Вместо того чтобы напрямую учить параметры модели, гиперсеть учится отображать условия задачи в пространство весов.

💡 Это позволяет моделям быстро адаптироваться к новым задачам без полного переобучения.

Где применяются:
—Meta-learning — обучение тому, как обучаться;
—Continual learning — постоянное обновление знаний без «забывания» старых;
—Multi-task learning — эффективная работа на множестве задач одновременно.

Примеры из жизни:
— персонализированные рекомендации;
— адаптивное управление системами;
— динамические обновления моделей на устройствах с ограниченными ресурсами.

В двух словах:
Гиперсети — это сети, которые учат сети.


🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
🎁 И мозг прокачать, и макбук утащить!

Proglib.academy разыгрывает MacBook Pro 14 (M3 Pro, 36 GB, 1 TB SSD) 💻

Условия:

1️⃣ Покупаешь любой курс Proglib до 15 ноября.
2️⃣ Проходишь минимум 2 учебные недели (можно осилить за два вечера).
3️⃣ Пишешь куратору в чат своего курса: #розыгрыш.

Что за курсы?

Математика для Data Science (6 месяцев боли и просветления).
Основы Python, ML, алгоритмы, AI-агенты и даже курс для тех, кто в IT, но не кодит.

👉 Участвовать в розыгрыше
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Multi-Head Attention в LLM: визуально объяснено

Механизм multi-head attention позволяет модели одновременно смотреть на текст под разными «углами зрения».

Вместо одной единственной «внимательной» функции, модель использует несколько, что делает понимание контекста глубже и точнее.

🔍 В итоге multi-head attention — это ключевой элемент, благодаря которому LLM способны понимать, связывать и обобщать текст на уровне, близком к человеческому.

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥31🙏1
💻 ВАЖНО: макбук ещё не забрали!

Proglib.academy продолжает розыгрыш MacBook Pro 14» (M3 Pro, 36 Гб, 1 Тб SSD).

Что нужно для участия?

— Берёшь любой курс Академии до 15 ноября.
— Проходишь хотя бы 2 недели обучения (можно за два дня).
— Пишешь куратору #розыгрыш. Всё — ты в игре!

Что за курсы?

▫️Алгоритмы и структуры данных — если хочешь готовиться к собесам в Яндекс, FAANG и не сидеть на джуне вечно.

▫️Архитектуры и шаблоны проектирования — учат думать как senior, а не просто писать код.

▫️ Python, математика для DS, основы IT и другие темы — можно стартовать с нуля или усилить то, что уже знаешь.

👉 Влетай, не думай!
2🔥1
➡️ LEANN — сверхлёгкий локальный векторный поиск

LEANN умеет индексировать и искать по миллионам документов, используя на 97% меньше хранилища, чем традиционные решения — без потери точности.

💡 Это достигается с помощью графовой селективной рекомпутации и high-degree preserving pruning — эмбеддинги вычисляются по запросу, а не хранятся заранее.

Ключевые особенности:
— Приватность — всё работает локально, без облака и скрытых условий.
— Лёгкость — графовая обрезка и CSR-формат уменьшают потребление памяти и места.
— Портативность — легко переносите базу знаний между устройствами.
— Масштабируемость — устойчив к «грязным» данным и памяти агентов, где другие БД падают.
— Точность — качество поиска как у тяжёлых решений, но с минимальными ресурсами.

➡️ Ссылка на репозиторий

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥1
⚙️ Хакатон Alert: Москва. Scoop AI хакатон от SpoonOS | Neo | DeFrens

📍Регистрация здесь
🗓 Даты: 21 октября - 23 ноября
ℹ️ Подробности и условия участия в нашем Дзене
💬 Телеграмм-чат хакатона - вступить
Вводный урок для начинающих - видео

SpoonOS — фреймворк для AI-агентов от Neo.org

Хакатон от Neo и SpoonOS по имплементации AI уже начался, и можно начинать делать проекты прямо сейчас.

А 23 ноября в Москве мы проведём финал. Для участников хакатона — это:

- Возможность задать вопрос специалисту по SpoonOS
- Панельные дискуссии
- Демо презентации сделанных проектов
- Призовой фонд в $7,000 для победителей

А ещё — медийное внимание, новые контакты в отрасли и инвестиционные возможности ждут лучшие проекты.

Возможные направления разработки:

- Ончейн-процессы и автономное исполнение
- Социальные симуляции и ИИ в играх
- Инфраструктура для хостинга агентов и безопасность
- DeFi, NFT и управление ДАО
- Биотех

Реклама. Суслов Денис Андреевич, ИНН 280121362361. Erid 2VtzqufMttX
Please open Telegram to view this post
VIEW IN TELEGRAM
2😁2
🆕 Свежие новости для дата‑сайентистов

📂 Анализ и подготовка данных
Разведочный анализ текстовых данных — как проводить EDA для текстовых данных, извлекать инсайты и выявлять паттерны.
Статистика под капотом LinearRegression — почему минимизируем именно квадратичную ошибку и как это связано со статистикой.
Как некачественные данные подтачивают нейросети — разбор влияния плохих данных на обучение моделей и стратегии исправления.

🆕 ML и новые подходы
Nested Learning: новый ML-парадигм для continual learning — модели рассматриваются как набор вложенных задач оптимизации, что помогает избегать катастрофического забывания.
Beyond Standard LLMs — обзор альтернатив стандартным autoregressive LLM.

👆 Интересные наблюдения и эксперименты
В процессе обучения нейросетей получаются красивые фракталы — визуализация внутренней динамики обучения и фрактальных структур, возникающих в слоях нейросети.
Не верьте AI на слово: эксперимент с оптимизацией — практический кейс, демонстрирующий ограничения моделей и как проверять результаты на практике.
Забудьте про точность: для трекинга нужны десятки метрик — почему одной метрики мало, и как мульти-метрический подход улучшает оценку качества моделей.

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
1
💻 Хочешь MacBook Pro? Просто начни учиться!

Да-да, вы не ослышались: Proglib.academy дарит макбук за учёбу!

Всё просто:

— купи любой курс Академии до 15 ноября;
— пройди 2 недели обучения (можно за два дня);
— напиши куратору в чате курса хэштег #розыгрыш.

📚 Выбирай свой курс:

▫️ «Математика для DS» — для тех, кто хочет уверенно работать с данными;
▫️ «Основы Python» — чтобы начать писать код с нуля;
▫️ «Алгоритмы и структуры данных» — для будущих инженеров;
▫️ «AI-агенты» или «Машинное обучение» — для тех, кто хочет прокачаться в ИИ.

👉 Участвовать в розыгрыше
🥰2
📊 Визуальная теория информации

Иногда новые способы думать о мире появляются неожиданно. Особенно классно, когда смутная идея превращается в чёткую концепцию. Информационная теория — отличный пример.

Она даёт точный язык для описания неопределённости, взаимосвязи знаний и степени схожести убеждений. Эти идеи применяются повсюду: от сжатия данных до квантовой физики и машинного обучения.

Хорошая новость: информационная теория вовсе не должна пугать. Многие её основные идеи можно объяснить полностью визуально!

➡️ Подробнее: https://clc.to/LrrdXA

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
🛒 Black Friday от Proglib.academy!

Только до 30 ноября — скидка 40% на ВСЕ курсы.

Пора добавить в корзину не носки, а новые скиллы: Python, математика для Data Science, AI, алгоритмы и структуры данных, ML.

🎓 Выбирай курс, который реально двинет тебя в карьере, и учись со скидкой.

👉 Учиться со скидкой
1🥰1
🖥 Разработчик из Yandex Cloud вошёл в топ-50 главных контрибьюторов PostgreSQL

Андрей Бородин, руководитель разработки СУБД с открытым исходным кодом в Yandex Cloud, получил статус major contributor. Это серьёзное признание: попасть в число 52 «главных» в самой популярной опенсорсной СУБД — задача не из лёгких. Туда не берут за разовые коммиты, только за годы работы и суровые ревью от core-команды. Приятно, что Postgres, на котором работает даже ChatGPT, активно развивается и нашими специалистами.

Кстати, команда Андрея разрабатывает и свой опенсорс, вроде роутера SPQR для масштабирования баз данных. На его основе в сентябре в превью запустили Managed Service for Shared PostgreSQL для горизонтального масштабирования кластеров.
👍6🔥3
🦉 Ovis (Open VISion): новая архитектура мультимодальных LLM

Ovis — это новая архитектура Multimodal Large Language Model (MLLM), созданная для структурного выравнивания визуальных и текстовых эмбеддингов.

Модель открывает путь к более глубокому пониманию изображений и текста в едином пространстве представлений — шаг к действительно связным мультимодальным ИИ-системам.

📱 Ссылка на репозиторий

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1