Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.9K subscribers
2.19K photos
110 videos
64 files
4.6K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🔝 25 самых важных математических определений в Data Science

Собрали ключевые математические формулы, которые должен знать каждый специалист по данным. Что бы вы добавили в качестве 25?
10👍6🤩2
🔍 Выявление сезонности во временных рядах через преобразование Фурье

Визуальный анализ — не единственный способ найти сезонные паттерны. Преобразование Фурье позволяет выявить скрытые периодические компоненты данных.

В статье рассматриваются:
📌 Что такое преобразование Фурье?
📌 Как использовать его в Python?
📌 Что такое периодограмма и как она помогает найти сезонность?

👉 Статья по теме: https://clc.to/DJQK8g
👍93
🗺️ GEOSpy AI может вычислить ваше точное местоположение всего по одному снимку.

Ссылка на проект: https://clc.to/1lCBfA

Что вы об этом думаете? Реальность или страшное будущее? 😨
1
📊 Изучаем sklearn.metrics.pairwise в Scikit-learn

В этом разборе мы исследуем подмодуль sklearn.metrics.pairwise, который предоставляет инструменты для вычисления попарных расстояний и аффинностей между выборками.
👍63🔥1
Шпаргалка из 40 методов NumPy, которые используются в 95% случаев
👾8👍42❤‍🔥1
📈 BI на максималках: 4 варианта ускорения реализации комплексных решений

Четыре проверенных способа сократить время реализации BI-проектов без потери функциональности. Реальный опыт backend-разработчика, который поможет вам избежать типичных ошибок при внедрении Business Intelligence.

Подробнее в нашей статье: https://proglib.io/sh/YuEShfjNiD
1👍1
Media is too big
VIEW IN TELEGRAM
📊 Тренды Data Science в 2025 году

Proglib рассказывает про новости из мира анализа данных в формате рилса
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3
Самые полезные каналы для программистов в одной подборке!

Сохраняйте себе, чтобы не потерять 💾

🔥Для всех

Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы
Азбука айтишника — здесь мы познаем азы из мира программирования

🤖Про нейросети
Библиотека робототехники и беспилотников | Роботы, ИИ, интернет вещей
Библиотека нейрозвука | Транскрибация, синтез речи, ИИ-музыка
Библиотека нейротекста | ChatGPT, Gemini, Bing
Библиотека нейровидео | Sora AI, Runway ML, дипфейки
Библиотека нейрокартинок | Midjourney, DALL-E, Stable Diffusion

#️⃣C#

Книги для шарпистов | C#, .NET, F#
Библиотека шарписта — полезные статьи, новости и обучающие материалы по C#
Библиотека задач по C# — код, квизы и тесты
Библиотека собеса по C# — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel

☁️DevOps

Библиотека devops’а — полезные статьи, новости и обучающие материалы по DevOps
Вакансии по DevOps & SRE
Библиотека задач по DevOps — код, квизы и тесты
Библиотека собеса по DevOps — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования

🐘PHP

Библиотека пхпшника — полезные статьи, новости и обучающие материалы по PHP
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты

🐍Python

Библиотека питониста — полезные статьи, новости и обучающие материалы по Python
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты

Java

Книги для джавистов | Java
Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков

👾Data Science

Книги для дата сайентистов | Data Science
Библиотека Data Science — полезные статьи, новости и обучающие материалы по Data Science
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту

🦫Go

Книги для Go разработчиков
Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go

🧠C++

Книги для C/C++ разработчиков
Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++

💻Другие каналы

Библиотека фронтендера
Библиотека мобильного разработчика
Библиотека хакера
Библиотека тестировщика
Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности
Библиотека разработчика игр | Gamedev, Unity, Unreal Engine

📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈

Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT

Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook *
🔸Instagram *

* Организация Meta запрещена на территории РФ
👍1
💡 Лайфхак: если столбчатая диаграмма слишком загромождена, замените её точечным графиком или пузырьковой диаграммой.

Так данные будут чище и нагляднее!
👍17🔥2🥰1
🚀 Data Formulator: AI для визуализации данных

Microsoft Research представили Data Formulator — инструмент, который использует ИИ для быстрого преобразования данных и создания визуализаций.

🔹 Комбинирует ввод через UI и естественный язык
🔹 Облегчает настройку графиков
🔹 Автоматизирует преобразование данных

Ссылка на проект: https://clc.to/CXVyBw
1🎉1
📌 Методы машинного обучения и их параметры

Делимся подборкой основных методов ML и ключевых параметров, которые влияют на их работу.
👍71
📊 Как себя чувствует IT-рынок в 2025 году?

Друзья, запускаем важное исследование рынка труда в IT!

Нам очень важно понять:
• Как изменились зарплаты
• Что происходит с наймом
• Есть ли сокращения или рост

🔐 Опрос полностью анонимный
⏱️ Займёт всего 3-5 минут
📈 Результаты опубликуем в подробной статье

Ваши ответы помогут составить реальную картину происходящего в индустрии.

👉 Пройти опрос (https://docs.google.com/forms/d/e/1FAIpQLSd4V4ESNVRL4w6iYaYqLS2LEL0YW-VmILvs0_43qYvvnte5iw/viewform)
😁1💯1
🐳 Делаем конкурента DeepSeek R1-Zero на домашней пекарне: метод GRPO в Unsloth

Обычно LLM требуют мощных GPU, но теперь даже на видеокарте с ограниченной памятью можно обучать модели логического рассуждения.

💡 Фишка — новый алгоритм GRPO, который позволяет моделям развивать логическое мышление без вмешательства человека.

Подробнее в нашей статье: https://proglib.io/sh/MyBCbq9is5
2
This media is not supported in your browser
VIEW IN TELEGRAM
💘 14 февраля: песня о любви… от нейросети

Лучшее, что можно сделать в День всех влюбленных? Конечно, признаться в любви… к своей работе! ❤️

Мы предсказываем будущее, строим модели, оживляем нейросети — без нас мир был бы совсем другим! Чтобы отпраздновать этот день, мы попросили ИИ написать гимн всех дата-сайентистов. И вот что получилось:

«В потоке данных я как супергерой,
Собираю инсайты одной рукой»


🎧 Включайте видео и заряжайтесь вдохновением!

А за что вы любите (или не очень) свою работу? Делитесь в комментариях! ⬇️
🔥42👍2
📊 ETL, ELT и EtLT — в чём разница?

Если эти аббревиатуры кажутся вам загадочным шифром, давайте разбираться!

🔹 ETL (Extract, Transform, Load) — сначала преобразуем, потом загружаем.
Высокое качество данных, экономия места.
Долго, сложно менять трансформации.

🔹 ELT (Extract, Load, Transform) — сначала загружаем, потом трансформируем.
Гибкость, скорость.
Дороже, требует сильного хранилища, ошибки обнаруживаются позже.

🔹 EtLT (Extract, tiny Load, Transform) — компромисс между первыми двумя.
Оптимальный баланс скорости и качества, фильтрация мусора на ранних этапах.
Сложнее в реализации, мало инструментов.

Какой метод используете вы?
👍63
👉 Что такое Preswald?

Preswald — это полнофункциональная платформа для создания, развертывания и управления интерактивными дата-приложениями. Она объединяет загрузку, хранение, обработку и визуализацию данных в одном мощном и лёгком SDK.

🔹 Простота кода — минимум Python и SQL для создания мощных приложений
🔹 Полный цикл — от ETL до визуализации в одной платформе
🔹 Эффективность — убирает лишнюю сложность, сохраняя гибкость

Ссылка на проект: https://clc.to/JyyQfw
👍31