Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.24K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Forwarded from Книги для дата сайентистов | Data Science
📚DevOps for Data Science (2024)

✍️Автор: Alex K Gold

📃Страниц: 273

В этой книге собраны уроки DevOps и применены их к созданию и реализации проектов по обработке данных производственного уровня на Python и R. В первом разделе этой книги рассказывается о том, как создавать проекты по обработке данных, которые будут внедряться в производство без излишеств и суеты. Во втором разделе рассматриваются основы администрирования сервера, включая Linux, администрирование приложений и сети, а в заключительном разделе раскрываются проблемы корпоративных ИТ/администрирования, что позволяет специалистам по обработке данных взаимодействовать и сотрудничать с командами безопасности, сетевого обеспечения и администрирования своей организации.

Скачать книгу
👏7🎉4
👾🛡️🤖 42 секунды и 5 запросов: как взламывают генеративные ИИ-модели

Ты знал, что злоумышленникам для взлома генеративных ИИ достаточно всего 42 секунды и пяти запросов? В этой статье мы разберём, как это происходит, какие уязвимости существуют и как защитить свои системы от подобных атак.

👉 Читать здесь
👍4😁2
🏋️ Как загружать веса моделей, если ресурсы ограничены?

Допустим, у вас не так много памяти на GPU, но вам нужно сохранить модель, используя torch.save(model.state_dict(), 'model.pth'), и продолжить её обучение позднее.

👉В этом ноутбуке собраны советы для того, чтобы решить задачу.
👍6
Опрос «Как вы учитесь с помощью телефона: поделитесь своим опытом!»

Дорогие подписчики, мы на миссии улучшений, и вы — наш ключ! 🔑


Мы хотим стать ещё круче, и для этого нужно узнать, как вы учитесь!

Заполните мини-анкету о том, как вы используете мобильные приложения для прокачки знаний.

Займёт всего 5 минут — как раз успеете за чашкой кофе! А за ваш ценный вклад мы дарим 15% скидку на все курсы https://proglib.academy/ 🎁
👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🐼 PandasAI — библиотека для исследования данных с помощью естественного языка

Где использовать:
▪️ в Jupyter ноутбуках,
▪️ Streamlit-приложениях,
▪️ в виде REST API.

Как использовать: Просто формулировать вопросы к данным на естественном языке.

🔗 Демо в Google Colab
🔗 Репозиторий проекта
👍13🔥8
✍️👀 Опубликованы статьи для International Conference on Learning Representations (ICLR)

ICLR известна тем, что освещает передовые исследования методов глубокого обучения, используемых в ИИ и статистике. Конференция пройдёт в апреле 2025 года в Сингапуре, но уже сейчас можно почитать поданные на неё статьи.

👉 Вот ссылка
🔥3
✏️ Разбор задачи с экзамена ШАД

Условие: Линейный оператор φ действует на пространстве многочленов степени не выше 2 с вещественными коэффициентами. Известно, что 1️⃣. Найдите сумму действительных собственных значений оператора φ (сумму следует вычислять с учетом алгебраической кратности собственных значений).

Подсказка: Найдите матрицу данного оператора и её характеристический многочлен.

Решение: Матрица Φ данного оператора в базисе x^2,x,1 удовлетворяет уравнению AΦ^T = B где 2️⃣ откуда 3️⃣ поэтому 4️⃣. Это и есть ответ, так как все собственные значения матрицы Φ^T вещественные. Это следует из того, что ее характеристический многочлен 5️⃣ имеет 3 действительных корня, так как f(0)>0, f(1)<0.

#задачи_шад
👍41
💬 Вы когда-нибудь ощущали, что не заслуживаете той зарплаты, которую получаете?

❤️ — да, знакомо это чувство
👍 — я считаю, что получаю ровно столько, сколько заслуживаю
🤔 — мне наоборот кажется, что мне недостаточно много платят

#интерактив
🤔6328👍10
Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉контент-менеджеров для ведения телеграм-каналов
👉Переводчик и автор оригинальных статей

Подробности тут

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾
❤️ Вышел PyTorch 2.5

Новый бэкенд CuDNN для SDPA, обеспечивающий ускорение до 75%;
Сокращено время холодного запуска torch.compile благодаря сборке nn.Module без перекомпиляции;
Оптимизирован бэкенд TorchInductor CPP.

🔗 Обо всех подробностях читайте здесь
🔥6👾2
🤼 Генеративно-состязательная нейросеть: ваша первая GAN-модель на PyTorch

Подробная инструкция построения генеративно-состязательных нейросетей (GAN) на примере двух моделей, реализованных с помощью фреймворка глубокого обучения PyTorch в нашей статье. 👇

🔗 Статья

У нас есть курс как для начинающих программистов, так и для тех, кто уже шарит:
🔵 Алгоритмы и структуры данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓Turbo-Alignment — библиотека для дообучения и элайнмента LLM от Т-Банка

Основные фичи:

📊 Включает необходимые метрики, в том числе self-bleu.
🛠 Упрощённый процесс деплоя новых методов.
⚡️ Оптимизирована для быстрого инференса с vLLM.
🌐 Поддерживает мультимодальность.
🔍 Есть пайплайн для RAG.

🔗 Ссылка на библиотеку
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Master_SQL.pdf
754.9 KB
✍️ Шпаргалка по SQL

Внутри:

▪️основные виды запросов;
▪️CASE и оконные функции;
▪️вложенные запросы;
▪️виды join;
▪️примеры запросов.
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
👀 Это наглядная визуализация того, как работает написанный Карпаты прямой проход по gpt-2.
7
✏️ Книги по Big Data / DataScience

Вот подборка книг для изучения Data Science.


Начать бывает сложно и пугает английский, но эти книги помогут разобраться в основах и понять ключевые концепции. Если у вас есть вопросы или нужны рекомендации, пишите в комментариях — давайте учиться вместе
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73