Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
📊 Визуальная теория информации

Иногда новые способы думать о мире появляются неожиданно. Особенно классно, когда смутная идея превращается в чёткую концепцию. Информационная теория — отличный пример.

Она даёт точный язык для описания неопределённости, взаимосвязи знаний и степени схожести убеждений. Эти идеи применяются повсюду: от сжатия данных до квантовой физики и машинного обучения.

Хорошая новость: информационная теория вовсе не должна пугать. Многие её основные идеи можно объяснить полностью визуально!

➡️ Подробнее: https://clc.to/LrrdXA

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
🛒 Black Friday от Proglib.academy!

Только до 30 ноября — скидка 40% на ВСЕ курсы.

Пора добавить в корзину не носки, а новые скиллы: Python, математика для Data Science, AI, алгоритмы и структуры данных, ML.

🎓 Выбирай курс, который реально двинет тебя в карьере, и учись со скидкой.

👉 Учиться со скидкой
1🔥1🥰1
🖥 Разработчик из Yandex Cloud вошёл в топ-50 главных контрибьюторов PostgreSQL

Андрей Бородин, руководитель разработки СУБД с открытым исходным кодом в Yandex Cloud, получил статус major contributor. Это серьёзное признание: попасть в число 52 «главных» в самой популярной опенсорсной СУБД — задача не из лёгких. Туда не берут за разовые коммиты, только за годы работы и суровые ревью от core-команды. Приятно, что Postgres, на котором работает даже ChatGPT, активно развивается и нашими специалистами.

Кстати, команда Андрея разрабатывает и свой опенсорс, вроде роутера SPQR для масштабирования баз данных. На его основе в сентябре в превью запустили Managed Service for Shared PostgreSQL для горизонтального масштабирования кластеров.
👍7🔥6
🦉 Ovis (Open VISion): новая архитектура мультимодальных LLM

Ovis — это новая архитектура Multimodal Large Language Model (MLLM), созданная для структурного выравнивания визуальных и текстовых эмбеддингов.

Модель открывает путь к более глубокому пониманию изображений и текста в едином пространстве представлений — шаг к действительно связным мультимодальным ИИ-системам.

📱 Ссылка на репозиторий

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Drag-and-drop UI для создания AI-агентов

Langflow — мощный визуальный инструмент для сборки и деплоя AI-агентов и рабочих процессов без единой строки кода.

🈁 Поддерживает все основные LLM, векторные БД и другие инструменты.
🈁 Идеально для быстрого прототипирования и продакшн-воркфлоу.

📱 Репозиторий

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
🤗 Как выбрать правильную модель: теперь можно протестировать всех

Больше выбора — значит, больше решений: какую модель взять?

Но чем больше моделей, тем важнее тестирование.

Теперь это стало проще: вышла новая интеграция с Inspect AI.

С Inspect можно:
— сравнивать модели в агентных сценариях и vision-language задачах
— находить целевые модели из Hub и тестировать их на своих задачах
— запускать сравнения без скачиваний и без GPU — всего за пару строк Python

➡️ Гид по ссылке: https://clc.to/becBlw

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉31👍1😢1
🧠 DeepInverse: библиотека для решения обратных задач в компьютерном зрении с помощью глубокого обучения

DeepInverse — это open-source библиотека на базе PyTorch, созданная для решения обратных задач в области обработки изображений.

Основные цели проекта:
— ускорить исследования в области глубокого обучения для задач восстановления изображений,
— повысить воспроизводимость экспериментов благодаря модульной архитектуре,
— снизить порог входа для новых исследователей и инженеров.

DeepInverse объединяет разные задачи и алгоритмы в единую удобную экосистему — от классических inverse problems до современных нейросетевых подходов.

📱 Репозиторий

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
📉 Зачем применять PCA перед K-means кластеризацией

Если хочется сделать кластеризацию точнее, быстрее и понятнее — связка PCA + K-means работает удивительно эффективно.

Что даёт PCA перед кластеризацией:
1️⃣ Упрощение данных — PCA собирает ключевую информацию из множества признаков в несколько главных компонент.
2️⃣ Снижение размерности — убирает лишние и шумовые признаки, оставляя только то, что реально объясняет вариативность данных.
3️⃣ Лучшая интерпретация — новые компоненты не коррелируют между собой, поэтому структура данных становится понятнее.
4️⃣ Оптимизация кластеров — K-means получает «очищенные» данные и формирует более чёткие и осмысленные кластеры.
5️⃣ Рост производительности — меньше измерений → быстрее обучение, особенно на больших датасетах.

Что вы получаете:
Более точные и чистые кластеры.
Быструю работу алгоритма.
Простую визуализацию данных в 2–3 компонентах.
Фокус на действительно важных признаках.

Связка PCA + K-means — отличный инструмент, чтобы преобразовать хаос признаков в чёткие структуры и ускорить анализ.

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42
📘 Хочешь в Data Science, но есть пробелы в знаниях математики?

Мы сделали экспресс-курс «Математика для Data Science», который за 2 месяца даст тебе фундамент, без которого ни одна ML-модель не взлетит 🚀

Что тебя ждёт:
🔹 живые вебинары с экспертами (НИУ ВШЭ, SberAI, Wildberries&Russ);
🔹 практика в Python, квизы и проверка заданий экспертами;
🔹 матрицы, регрессии, вероятности и статистика: всё на примерах из реальных задач;
🔹 старт — 4 декабря.

🔥 Не упусти халяву: сейчас 40% до 30 ноября

👉 Записаться на курс
🙌 Google Colab теперь в VS Code: лучшее из двух миров

Google официально выпустил расширение Colab для VS Code, позволяя использовать облачные мощности Colab — включая GPU и TPU — прямо в любимом редакторе кода:
🈁 Для пользователей VS Code: привычный workflow + подключение к мощным Colab-рутинам, включая Pro-tier GPU и TPU.
🈁 Для пользователей Colab: IDE-функции VS Code (расширяемость, интеграция с Git) при сохранении облачных вычислений и удобного коллаборационного опыта.

Как начать работу:
1. Установите Colab расширение из VS Code Marketplace.
2. Откройте .ipynb ноутбук и подключитесь к Colab runtime через Google аккаунт.
3. Запускайте ячейки с мощностью облака — всё прямо в VS Code!

Google планирует интегрировать ещё больше возможностей Colab в VS Code, делая разработку AI/ML быстрее и удобнее.

🔗 Попробовать сейчас: https://clc.to/rr53rw

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥5👍21🎉1
🆕 Свежие новости для дата‑сайентистов

🙌 Апдейты
Google Colab теперь в VS Code: лучшее из двух миров Google официально выпустил расширение Colab для VS Code.

🚀 AI & LLMs: новые модели и прорывы
GPT-5.1OpenAI представила две обновлённые модели.
Nano Banana 2 утекли первые сэмплы следующей версии модели.

🧠 Research
Google запускает File Search в Gemini APIфайл-хранилище, чанкинг, индексация и вставка контекста — всё теперь автоматизировано.
Nested LearningGoogle представила brain-inspired подход, где модель — это не одна задача оптимизации, а множество вложенных.

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
2