Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.24K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🤔 Основы математики в Machine Learning / Deep Learning

🗓 16 октября мы разберем ряд Тейлора, собственные векторы и другие ключевые понятия в ML – https://proglib.io/w/48c1efeb

Спикер: Иван Потапов – Staff Machine Learning Engineer at ShareChat. Руководит командой, отвечающей за качество рекомендаций, и имеет 8-летний опыт в сфере машинного обучения.

😮 Что будем обсуждать:

– Теорию вероятностей: случайные величины, математическое ожидание и дисперсию.

Линейную алгебру: векторы, матрицы, собственные векторы и собственные значения.

Математический анализ: производные и разложение функций в ряд Тейлора.

👨‍💻 А еще после каждого блока вас ждет практика в применении полученных знаний.

🎯 Почему это важно?
Понимание математических основ помогает глубже разобраться в работающих под капотом алгоритмах ML/DL и эффективно применять их на практике.

Присоединяйтесь к нам и совершенствуйте свои навыки в машинном обучении!

📌 Регистрация по ссылке: https://proglib.io/w/48c1efeb
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
✍️ Учимся понимать нормальное распределение

Когда мы хотим описать основные свойства распределения значений переменной, мы можем использовать среднее и стандартное отклонение:

▪️среднее показывает, где находится центр всех значений, то есть какое значение в среднем встречается чаще всего.
▪️стандартное отклонение показывает, насколько широко разбросаны значения вокруг этого среднего, то есть, насколько сильно значения отличаются друг от друга.

На этом сайте есть интерактивный график, который поможет лучше понять, как меняется распределение в зависимости от среднего и стандартного отклонения.
👍7
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
Как создаются анимации для канала 3Blue1Brown?

Если вы любите канал, то вам будет интересно посмотреть, как создатель 3Blue1Brown отвечает на самый популярный вопрос к нему.

🔗 Смотреть на YouTube

А если вы ещё не знакомы с этим каналом, то ознакомьтесь, там можно найти много интересного👇

🔸Но что такое нейронная сеть?
🔸Векторы | Глава 1. Сущность линейной алгебры
🔸Но что такое Центральная предельная теорема?
🥰61
🧑‍💻 Линейная регрессия и её регуляризация в Scikit-learn

Новая статья на «Хабре» рассматривает модели линейной регрессии, доступные в scikit-learn, а также объясняет, что такое регуляризация на примерах Ridge, Lasso и Elastic Net.

🔗 Читать статью
👍7
Forwarded from Книги для дата сайентистов | Data Science
📚DevOps for Data Science (2024)

✍️Автор: Alex K Gold

📃Страниц: 273

В этой книге собраны уроки DevOps и применены их к созданию и реализации проектов по обработке данных производственного уровня на Python и R. В первом разделе этой книги рассказывается о том, как создавать проекты по обработке данных, которые будут внедряться в производство без излишеств и суеты. Во втором разделе рассматриваются основы администрирования сервера, включая Linux, администрирование приложений и сети, а в заключительном разделе раскрываются проблемы корпоративных ИТ/администрирования, что позволяет специалистам по обработке данных взаимодействовать и сотрудничать с командами безопасности, сетевого обеспечения и администрирования своей организации.

Скачать книгу
👏7🎉4
👾🛡️🤖 42 секунды и 5 запросов: как взламывают генеративные ИИ-модели

Ты знал, что злоумышленникам для взлома генеративных ИИ достаточно всего 42 секунды и пяти запросов? В этой статье мы разберём, как это происходит, какие уязвимости существуют и как защитить свои системы от подобных атак.

👉 Читать здесь
👍4😁2
🏋️ Как загружать веса моделей, если ресурсы ограничены?

Допустим, у вас не так много памяти на GPU, но вам нужно сохранить модель, используя torch.save(model.state_dict(), 'model.pth'), и продолжить её обучение позднее.

👉В этом ноутбуке собраны советы для того, чтобы решить задачу.
👍6
Опрос «Как вы учитесь с помощью телефона: поделитесь своим опытом!»

Дорогие подписчики, мы на миссии улучшений, и вы — наш ключ! 🔑


Мы хотим стать ещё круче, и для этого нужно узнать, как вы учитесь!

Заполните мини-анкету о том, как вы используете мобильные приложения для прокачки знаний.

Займёт всего 5 минут — как раз успеете за чашкой кофе! А за ваш ценный вклад мы дарим 15% скидку на все курсы https://proglib.academy/ 🎁
👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🐼 PandasAI — библиотека для исследования данных с помощью естественного языка

Где использовать:
▪️ в Jupyter ноутбуках,
▪️ Streamlit-приложениях,
▪️ в виде REST API.

Как использовать: Просто формулировать вопросы к данным на естественном языке.

🔗 Демо в Google Colab
🔗 Репозиторий проекта
👍13🔥8
✍️👀 Опубликованы статьи для International Conference on Learning Representations (ICLR)

ICLR известна тем, что освещает передовые исследования методов глубокого обучения, используемых в ИИ и статистике. Конференция пройдёт в апреле 2025 года в Сингапуре, но уже сейчас можно почитать поданные на неё статьи.

👉 Вот ссылка
🔥3
✏️ Разбор задачи с экзамена ШАД

Условие: Линейный оператор φ действует на пространстве многочленов степени не выше 2 с вещественными коэффициентами. Известно, что 1️⃣. Найдите сумму действительных собственных значений оператора φ (сумму следует вычислять с учетом алгебраической кратности собственных значений).

Подсказка: Найдите матрицу данного оператора и её характеристический многочлен.

Решение: Матрица Φ данного оператора в базисе x^2,x,1 удовлетворяет уравнению AΦ^T = B где 2️⃣ откуда 3️⃣ поэтому 4️⃣. Это и есть ответ, так как все собственные значения матрицы Φ^T вещественные. Это следует из того, что ее характеристический многочлен 5️⃣ имеет 3 действительных корня, так как f(0)>0, f(1)<0.

#задачи_шад
👍41
💬 Вы когда-нибудь ощущали, что не заслуживаете той зарплаты, которую получаете?

❤️ — да, знакомо это чувство
👍 — я считаю, что получаю ровно столько, сколько заслуживаю
🤔 — мне наоборот кажется, что мне недостаточно много платят

#интерактив
🤔6328👍10
Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉контент-менеджеров для ведения телеграм-каналов
👉Переводчик и автор оригинальных статей

Подробности тут

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾
❤️ Вышел PyTorch 2.5

Новый бэкенд CuDNN для SDPA, обеспечивающий ускорение до 75%;
Сокращено время холодного запуска torch.compile благодаря сборке nn.Module без перекомпиляции;
Оптимизирован бэкенд TorchInductor CPP.

🔗 Обо всех подробностях читайте здесь
🔥6👾2
🤼 Генеративно-состязательная нейросеть: ваша первая GAN-модель на PyTorch

Подробная инструкция построения генеративно-состязательных нейросетей (GAN) на примере двух моделей, реализованных с помощью фреймворка глубокого обучения PyTorch в нашей статье. 👇

🔗 Статья

У нас есть курс как для начинающих программистов, так и для тех, кто уже шарит:
🔵 Алгоритмы и структуры данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓Turbo-Alignment — библиотека для дообучения и элайнмента LLM от Т-Банка

Основные фичи:

📊 Включает необходимые метрики, в том числе self-bleu.
🛠 Упрощённый процесс деплоя новых методов.
⚡️ Оптимизирована для быстрого инференса с vLLM.
🌐 Поддерживает мультимодальность.
🔍 Есть пайплайн для RAG.

🔗 Ссылка на библиотеку
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Master_SQL.pdf
754.9 KB
✍️ Шпаргалка по SQL

Внутри:

▪️основные виды запросов;
▪️CASE и оконные функции;
▪️вложенные запросы;
▪️виды join;
▪️примеры запросов.
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
👀 Это наглядная визуализация того, как работает написанный Карпаты прямой проход по gpt-2.
7