Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Выбор хорошего формата файла для Pandas

CSV, JSON, Parquet — какой формат данных следует использовать для данных Pandas? Автор статьи сравнивает их и дает рекомендации.

Читать статью
👍3🔥21
Спортивная аналитика с открытым исходным кодом с PySport

Если вы ищете забавные наборы данных для обучения, для преподавания, может быть, для выступления на конференции или даже если вы просто действительно увлечены ими, спорт предлагает непрерывный поток богатых данных, с которыми могут столкнуться многие люди.

Тем не менее, доступ к этим данным может быть сложным. Иногда он заблокирован в неясных форматах файлов. В других случаях данные существуют, но без четкого API для доступа к ним.

В этом подкасте говорят о PySport — удивительном списке широкого спектра библиотек (в основном Python) для доступа к широкому спектру спортивных данных из НФЛ, НБА, Ф1 и других.

Читать статью
👍4😁1
Метод Python .__call__(): создание вызываемых экземпляров

В этой статье рассказано, что такое вызываемый объект в Python и как создавать вызываемые экземпляры с помощью специального метода .call() в ваших классах. Также прилагаются несколько примеров практического использования вызываемых экземпляров в Python.

Читать статью
👍1
Не дайте себя одурачить дрейфом данных

Если вы ищете информацию о мониторинге ML в Интернете, есть большая вероятность, что вы столкнетесь с различными подходами к мониторингу, выступающими за то, чтобы поставить дрейф данных в центр решений для мониторинга.

Цель этой записи в блоге — продемонстрировать, что не все смещения данных влияют на производительность модели. Доверие к методам дрейфа падает, поскольку они, как правило, вызывают большое количество ложных срабатываний. Чтобы проиллюстрировать этот момент, автор обучает модель машинного обучения с использованием реального набора данных, отслеживает распределение функций модели в производственной среде и заставляет модель сообщать о любом отклонении данных, которое может произойти.

Читать пост
👍2
🧮 Что такое математический анализ и как он используется в программировании

Расскажем, для чего матанализ нужен в программировании, и как в нем разобраться максимально быстро без головной боли.

🔗 Основной сайт
🔗 Зеркало
👍3
😈Открываем чит-коды технического интервью на позицию в сфере Data Science.

7 июня в прямом эфире разберем основные математические задачи на собеседованиях в крупные российские и международные компании.

👉Зарегистрироваться: https://proglib.io/w/f2a10b35

Приглашенный спикер: Иван Строков – ML инженер в Yelp, запустивший отдел Data Science для pikabu.ru

🚀 На вебинаре:

1. Обсудим задачи из реальных интервью в российские и европейские компании
2. Решим задачи на матрицы и вероятности
3. Научимся быстро тестировать статистические гипотезы для А/Б тестов
4. Обсудим, какая математика лежит под капотом ML алгоритмов
5. Узнаем, что делать, если математика становится слишком сложной

👉Зарегистрироваться: https://proglib.io/w/f2a10b35
👍2
Какие знания в области математики требуются специалистам в Machine Learning и Data Science?

Валентин Рябцев, сооснователь и CPO Wale. ai, рассказал о своем карьерном пути, о том как развивать математическое мышление и как улучшать качество продукта с помощью математических методов.

Рекомендуем к просмотру – https://www.youtube.com/watch?v=KhUXzcrAk0M
👍1
👾 «Как я спас робота от жены»

Программисты — интересные люди. Они могут потратить часы своего времени чтобы реализовать сложную, но интересную вещь.

В этом видео автор использовал компьютерное зрение, нейросети и смекалку программиста, чтобы спасти робота-пылесоса от ужасной участи оказаться на свалке.

Смотреть видео
👍3
👀 Big data, дополненная реальность и компьютерное зрение

В этом видосе Data Scientist из компании Banuba поделился своим опытом с новичками и дал парочку полезных советов.

Вы узнаете про разницу Data analysis и Data Science, что такое Data mining, какие есть виды машинного обучения и поймёте всё (почти всё), что связанно с этой профессией.

Перейти к просмотру
🎡 Что такое комбинаторика и как она используется в программировании

Расскажем, какие задачи помогает решать комбинаторика и зачем программистам нужно ее знать.

Читать статью
👍3
🐍 25 алгоритмов динамического программирования, которые должен знать каждый программист

В этой статье мы рассмотрим 25 основных алгоритмов динамического программирования с реализацией на Python, которые должен знать каждый, кто увлекается спортивным программированием.

🔗 Основной сайт
🔗 Зеркало
👍3
Улучшение математических рассуждений с контролем процесса

Мы обучили модель для достижения нового уровня техники в решении математических задач, вознаграждая каждый правильный шаг рассуждений («наблюдение за процессом») вместо простого вознаграждения за правильный окончательный ответ («наблюдение за результатом»). В дополнение к повышению производительности по сравнению с надзором за результатами, надзор за процессами также имеет важное преимущество согласования: он напрямую обучает модель создавать цепочку мыслей, которую одобряют люди…

Читать дальше
👍3
Подкаст Super Data Science № 681: XGBoost: The Ultimate Classifier с Мэттом Харрисоном

В подкасте объясняется, как раскрыть потенциал XGBoost, научиться тонко настраивать его гиперпараметры и определять оптимальные ситуации моделирования. Готовы ли вы обновить свой набор инструментов для обработки данных всего за один час?

Слушать подкаст
🔥21👍1
⚗️ 5 областей применения линейной алгебры в программировании

Расскажем, какие практические задачи помогает решать линейная алгебра, и как абстрактные матрицы и линейные пространства могут пригодиться в разработке реального софта.

Читать статью
👍1
Прямо сейчас разбираем в прямом эфире задачи из интервью в российские и международные компании на позицию Data Scientist

🟢 Трансляция — https://www.youtube.com/watch?v=xINpWlT17tA

Присоединяйтесь!
2
🌵 Мексиканская перестрелка: какую IT-профессию выбрать джуну в 2023 году, чтобы зарабатывать $100кк в наносек

В этой статье мы рассмотрим несколько перспективных IT-направлений, которые приблизят вас к заветным цифрам на вашем банковском счете.

Читать статью
👍3
Получение нормально распределенных случайных чисел с помощью NumPy

В этом руководстве вы узнаете, как использовать NumPy для генерации случайных чисел с нормальным распределением. Нормальное распределение является одним из наиболее важных распределений вероятностей. С NumPy и Matplotlib вы можете как рисовать из дистрибутива, так и визуализировать свои образцы.

Читать статью
Первая часть: «Как создать многофункциональную социальную платформу на Django с опросами и тестами и развернуть готовое приложение на сервере. Часть 1»

***

➡️ С первой частью разобрался, когда выйдет вторая часть? Спать не могу, хочу задеплоить финальный проект
Держи: «Как создать многофункциональную социальную платформу на Django с опросами и тестами и развернуть готовое приложение на сервере. Часть 2»

💬 О чем пойдет речь на этот раз?
Создадим опросы и тесты. Ответы визуализируем с помощью Chart.js. Также настроим Nginx и Gunicorn для обработки запросов на сервере.

😎 Круто!
А то! Ссылку на итоговый результат и на репозиторий найдешь в начале статьи. Напиши в комментариях, какой проект сделать следующим!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
Создайте свой собственный инструмент распознавания лиц с помощью Python

В этом руководстве вы создадите свой собственный инструмент командной строки для распознавания лиц с помощью Python. Вы узнаете, как использовать распознавание лиц, чтобы идентифицировать лица на изображении и маркировать их. Обладая этими знаниями, вы сможете создать свой собственный инструмент распознавания лиц от начала до конца!

Читать статью
В Python 3.13 удалили 20 модулей Stdlib

Разработчики ядра заняты работой над PEP 594, удалением севших батарей из Python 3.13. В этом длинном сообщении на дискуссионном форуме рассказывается о том, какая работа уже завершена.

Читать пост
🤔3
Для чего нужна стандартная библиотека Python?

В этой публикации резюмируется разговор на саммите Python Language Summit, в котором предлагается определить правила, когда что-то следует добавлять в стандартную библиотеку.

Читать статью
👍3