Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
29 мая приглашаем на вебинар всех, кому интересна тема AI, Machine learning и Data Science!

👉 Зарегистрироваться: https://proglib.io/w/0a0b7421

Что будем обсуждать?

Математика как основа ИИ: Почему без математики невозможна эффективная работа в области AI
На что обращают внимание при найме ML/AI разработчиков: нужно ли фундаментальное образование?
Примеры математических методов применяемых в AI / Data Science
Ключевые роли и компетенции в AI команде: Data Engineer, ML Engineer, Data Scientist, Data Analyst

Кто спикер?

👨‍💻 Валентин Рябцев – Co-founder, CPO Wale, ex-руководитель глобальных ИТ-инноваций в Louis Dreyfus (Франция)

Регистрируйтесь, чтобы не пропустить прямой эфир https://proglib.io/w/0a0b7421
👍1
Маленькие языковые модели улучшают работу гигантов, переписывая их результаты.

https://arxiv.org/abs/2305.13514
5 распространенных ошибок на собеседованиях в Google

Вопреки распространенному мнению, отсутствие знаний о структуре данных не является основной причиной отказа кандидатам. В этой статье мы прольем свет на наиболее распространенные ошибки, которые допускают соискатели на собеседованиях в Google.

🔗 Основной сайт
🔗 Зеркало
Выбор хорошего формата файла для Pandas

CSV, JSON, Parquet — какой формат данных следует использовать для данных Pandas? Автор статьи сравнивает их и дает рекомендации.

Читать статью
👍3🔥21
Спортивная аналитика с открытым исходным кодом с PySport

Если вы ищете забавные наборы данных для обучения, для преподавания, может быть, для выступления на конференции или даже если вы просто действительно увлечены ими, спорт предлагает непрерывный поток богатых данных, с которыми могут столкнуться многие люди.

Тем не менее, доступ к этим данным может быть сложным. Иногда он заблокирован в неясных форматах файлов. В других случаях данные существуют, но без четкого API для доступа к ним.

В этом подкасте говорят о PySport — удивительном списке широкого спектра библиотек (в основном Python) для доступа к широкому спектру спортивных данных из НФЛ, НБА, Ф1 и других.

Читать статью
👍4😁1