Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
112 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🛠️ 9 инструментов для бэкенд-разработчика: ИИ-ассистент DevOps-инженера и Regular Expression Tester

От анализа гигантских лог-файлов до программирования GPU на Rust — 9 мощных инструментов, которые помогут вам оптимизировать рабочий процесс и решать сложные задачи в бэкенд-разработке

Читать статью
👏3
👾👀 Бесплатный курс HarvardX: Data Science: Machine Learning

Вот что вы узнаете на курсе:

▪️основы машинного обучения;
▪️как провести кросс-валидацию;
▪️как устроены несколько популярных алгоритмов машинного обучения;
▪️как построить рекомендательную систему;
▪️что такое регуляризация.

Чтобы начать изучать материалы, зарегистрируйтесь на сайте.

🔗 Ссылка на курс
👍52
⚡️ Вышел Keras 3.5.0

🔘Добавлена интеграция с Hugging Face Hub.
Теперь можно сохранять модели на Hugging Face Hub напрямую через keras.Model.save(), а также загружать .keras модели с Hub с помощью keras.saving.load_model().

🔘Обеспечена совместимость с NumPy 2.0.

🔘Добавлены новые методы и операции.

🔘Исправлены ошибки и улучшена производительность.

🔗 Ссылка на репозиторий
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🥱4🔥2🥰2
Свежий #дайджест по Data Science и машинному обучению

🔹Рекурсивный отбор признаков. Динамический шаг в танце feature selection
Статья представляет собой подробный обзор и сравнение методов отбора признаков, а также практические рекомендации по их применению в задачах машинного обучения.

🔹Docker Compose for ML Engineers
Это короткий ролик, который рассказывает о том, как использовать Docker Compose в проектах машинного обучения.

🔹Predicting results of social science experiments using Large Language Models
Интересная статья, которая показывает, что GPT-4 способна предсказывать результаты социальных экспериментов с довольно высокой точностью.

🔹Effective Machine Learning Teams: Best Practices for Ml Practitioners (2024)
Новая книга про лучшие практики для проектов машинного обучения.

🔹Я больше не верю публичным датасетам
Автор рассказал о своём опыте работы с публичными датасетами.
👍4🥰2
Привет, друзья! 👋

Мы готовим статью о производительности труда программистов и хотим узнать ваше мнение. Поделитесь своими мыслями, ответив на следующие вопросы:

Согласны ли вы с утверждением, что программирование — это на 9/10 мышление и только на 1/10 набор кода? 🤔

- Полностью согласен 💯
- Скорее согласен 👍
- Затрудняюсь ответить 🤷
- Скорее не согласен 👎
- Совершенно не согласен 🚫

Сколько времени в среднем вам потребуется, чтобы восстановить код, написанный за один рабочий день? ⏱️

- Менее 30 минут
- 30-60 минут
- 1-2 часа
- 2-4 часа
- Более 4 часов

Какие факторы, по вашему мнению, наиболее сильно влияют на производительность программиста? (выберите до 3 вариантов) 🚀

- Качество рабочей среды и инструментов 🛠️
- Ясность поставленных задач и требований 📝
- Возможность сосредоточиться без отвлечений 🧘
- Эффективная коммуникация в команде 🗣️
- Постоянное обучение и развитие навыков 📚
- Мотивация и интерес к проекту 💪
- Опыт и экспертиза в конкретной области 🏆
- Другое (укажите в комментариях) 💡

Поделитесь своими мыслями и опытом в комментариях! Как вы оцениваете соотношение «мышления» и «кодинга» в своей работе? Какие методы вы используете для повышения эффективности мыслительного процесса?
👍13🥰2💯1
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
This media is not supported in your browser
VIEW IN TELEGRAM
👆Наглядная схема устройства работы векторных баз данных👆
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰10👍3🥱2
Привет, друзья! 👋

Мы готовим статью на тему: «5 признаков зависимости от программирования». Нам очень важно ваше мнение! Поделитесь своим опытом и советами, и самые интересные из них мы включим в статью.

⌛️ Как вы понимаете, что программирование начинает занимать слишком много места в вашей жизни? Какие признаки вы замечаете?

🏄 Какие методы и стратегии вы используете, чтобы сохранить баланс между работой и личной жизнью?

😔 Был ли у вас опыт, когда программирование негативно влияло на ваши отношения с близкими или здоровье? Как вы справились с этим?

Ваши ответы помогут многим! Спасибо за участие!
👏5
🤖🛠️ ТОП-25 опенсорсных инструментов для вашего ИИ-проекта

В этой статье мы собрали 25 лучших инструментов с открытым кодом, которые помогут вам создать ИИ-проекты, автоматизировать процессы и расширить функциональность ваших приложений.

🔗 Ссылка на статью
👍3
👀 Marimo — реактивный Python-ноутбук; теперь с поддержкой SQL

Основные возможности:

▪️Запускаете ячейку и Marimo автоматически запускает все ячейки, зависящие от неё.

▪️Запускайте ваши ноутбуки как скрипты Python, параметризованные через аргументы командной строки.

▪️Встроенная поддержка SQL и панель для работы с источниками данных делают Marimo отличным инструментом для анализа данных.

▪️Ноутбуки Marimo сохраняются как файлы .py, что упрощает управление версиями через Git.

Поддержка SQL — это, кстати, совсем недавнее нововведение. Можно писать запросы и получать результаты в виде датафреймов.

🔗 Ссылка на репозиторий Marimo
👍81😁1
Привет, друзья! 👋

Мы готовим статью о том, как гарантированно провалить собеседование, и нам нужна ваша помощь! Поделитесь своим опытом и мнением, а самые интересные и полезные советы мы обязательно включим в нашу статью.

Какую самую нелепую ошибку вы когда-либо совершали на собеседовании?
Что, по вашему мнению, может мгновенно испортить впечатление о кандидате?

Не стесняйтесь делиться своими историями и мнениями в комментариях! Самые интересные и полезные советы попадут в нашу статью. 🚀 Спасибо за участие!
👍3
📈 Стать аналитиком Big Data: пошаговое руководство 2024

Рассказываем в нашей статье, какие знания, онлайн-курсы, подкасты и книги помогут начать карьеру в сфере Big Data без специального образования.

Ознакомьтесь со статьей, а также забирайте наши курсы для Data Science:
🔵 Базовые модели ML и приложения
🔵 Математика для Data Science

🔗 Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Как меняется математика в разных индустриях: от мобильных игр к фондовым рынкам

🗓 22 августа в прямом эфире разберем как математика применяется в разных отраслях бизнеса. И какие математические навыки необходимы для успешной работы в каждой из них.

Приглашенный спикер: Павел Запольский – Senior Quantitative Researcher at Exness и Co-founder GrowLytics. Запустивший более 10 проектов по машинному обучению и анализу данных для ведущих компаний.

😮 На вебинаре узнаете:

🔵 Математика в бизнесе: Чем отличаются разные сферы друг от друга. Почему стоит понимать специфику сферы
🔵 ML и продуктовое IT: Чем различается математическая сложность от индустрии к индустрии. Какие к ним необходимы уровни подготовки
🔵 Баевская математика в GameDev. Баевская математика как альтернатива AB тестированию. Как математические методы применяются в разработке игр
🔵 Finance: Что такое количественные финансы и математическое моделирование. Обсудим текущие индустриальные тренды в отрасли
🔵 Backtest: Как знания математики делают ваши активы более надежными
🔵 На практике подробно разберем два математических кейса по GameDev и Backtest.

➡️ Зарегистрироваться: https://proglib.io/w/dcdc91a6
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста | программирование, кодинг, разработка
🚀 Ускорьте свою базу данных: 7 проверенных методов масштабирования и оптимизации

Масштабирование улучшает производительность и повышает надежность систем хранения данных путем оптимизации использования ресурсов и распределения нагрузки. В этой статье мы рассмотрим 7 эффективных методов масштабирования и оптимизации базы данных.

🔗 Читать статью
🔗 Зеркало
👍3