Аналитика данных / Data Study
8.49K subscribers
411 photos
38 videos
24 files
333 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
Сегодня пополнение в моей библиотеке 😃

Какую первую начать читать? Голосуем реакциям)
👍 - левая книга
🔥 - правая книга
👍92🔥45😁5
Data Warehouse, Data Lake, Data Lakehouse, Data Fabric, Data Mesh – что это такое, и в чем разница между концепциями

Понравилась статья, делюсь как обычно с вами. Есть классная историческая справка (сможете похвастаться перед коллегами или на собесах знанием истории концепций хранилищ данных 😎). Если кто-то думает, что аналитика данных и Big Data зародились когда все об этом начали в рекламе курсов кричать, то вы далеко ошибаетесь, история уходит еще в 20 век.

Ну и лаконично описаны концепции хранилищ и показаны на визуальных схемах с основными элементами. Помогает понять зачем вообще такой зоопарк систем нужен и как это все обусловлено эволюцией подходов работы с данными.

Читать статью
👍156
Наткнулся на исследование затрат предпринимателей и наемных сотрудников.
Круто когда бизнес знает все доходы и расходы своего клиента 😎 Так могут «подсказывать» клиентам куда потратить 💵 на свои же продукты или подкинуть партнеров, которые тоже принесут доход)

Почитать полное исследование можно здесь
6👍5
Сходили вчера в Аптекарский огород

Это небольшой парк, в котором есть огромное количество разных видов растений как под открытым небом, так и в крытых галлереях.
Вход платный (есть льготные билеты), лучше идти в будни чтобы было меньше людей 😉

Локация
23👍10
💬 Кто такие Дата-инженеры (DE) и чем они занимаются?

Анализ данных - это работа аналитика, про которую я вам постоянно рассказываю. Но также я часто пишу про такие темы как ETL, батч и стриминг обработка данных, которые относятся уже к работе инженеров данных. Давайте обозначим кто и и чем занимается на проектах:

Аналитик данных
📍 оценка качества данных и подготовка данных для анализа (например, создание витрин данных)
📍 написание гипотез и непосредственно анализ данных (расчет метрик, проведение статистических экспериментов, описательный или прогнозный анализ данных)
📍 интерпретация результатов анализа для бизнеса, создание отчетов, дашбордов

Инженер данных
📍разработка потоков данных (ETL/ELT) и их автоматизация (чтобы данные из одного места автоматически попадали в другое место: например из CRM-системы в корпоративное хранилище)
📍настройка мониторинга работоспособности потоков данных (мало сделать сам поток, нужно чтобы он работал стабильно и качественно, а в этом может помочь мониторинг сбоев)
📍 оценка качества данных и подготовка данных для анализа (да, этим также как и аналитики могут заниматься инженеры данных)
Различие компетенций аналитика и инженера наглядно показано на картинке в посте

Упрощенную, но очень наглядную схему взаимодействия аналитика и инженера можно описать так:
1️⃣ Аналитик узнал у бизнеса какую задачу анализа требуется выполнить, перевел запрос бизнеса на техническое описание задачи (ТЗ - какие данные и где взять, в каком виде положить и как часто обновлять)
2️⃣ Инженер данных получил ТЗ от аналитика и выполнил его
3️⃣ ТЗ выполнено, аналитик получил данные, проанализировал, отдал результаты анализа бизнесу. Все счастливы и сделали свои куски работы

Рекомендую подписаться на канала Евгения "Я - Дата Инженер", если вы хотите еще больше узнать про работу инженера данных и какие навыки для этого нужны. Он кстати тоже работает в Сравни 😎

У него на канале есть огромное количество полезного материала:
🔗 Roadmap для Data Engineer
🔗 Видео про Hadoop HDFS
🔗 Канал на Youtube с подробными техническими видео про инструменты DE
Please open Telegram to view this post
VIEW IN TELEGRAM
👍146🔥6
pygwalker - библиотека Python для визуализации данных с удобным интерфейсом, очень схожим с Tableau.

Для быстрой визуализации результатов преобразований и анализа вообще супер! Всегда было запарно писать код для matplotlib или других визуалок, бывало что проще выгрузить sample данных в файлик и пойти повизуализировать в BI инструменте. Сейчас BI приехал прямо в Jupyter Notebook 🔥🔥🔥

Ссылка на описание pygwalker
🔥34👍103
Привет!

Для тех кто хочет погружаться в Машинное Обучение есть курс, который читают студентам НИУ ВШЭ на Факультете Компьютерных Наук.

Записи лекций и семинаров выложены на Github: https://github.com/esokolov/ml-course-hse
👍179🔥7
Управление безопасностью данных и распределения доступов с помощью CRUD-матрицы

🔎 CRUD-матрица -это один из методов управления информационной безопасностью в управлении данными. Используется подход построения матрицы данные-роли (столбцы матрицы) и данные-процессы (строки матрицы). Доступ управляется уровнями по аббревиатуре CRUD:
📍C (Create) - создание
📍R (Read) - чтение
📍U (Update) - обновление
📍D (Delete) - удаление

Иногда добавляют еще одно действие E (Execute) - выполнение

В каждую ячейку матрицы можно поставить как одно действие, так и сразу все, если эта роль должна иметь все доступы и возможности.
👍15
Всем отличного вечера пятницы)
🎉46😁26
Решил расламиться дома и смотрите что нашел. Это игрушка с самой первой аналитической конференции, которую я посетил когда еще работал в Леруа. Так бы и не вспомнил об этой конференции и множестве полезных игр и докладов, которые тогда посетили с коллегами.

Все таки вещи способны хранить воспоминания…
18👍8🔥6😁3
Решил сменить закрепленное сообщение в канале. Расскажу вам актуальную информацию о себе и зафиксирую некоторые посты канала 😉
Привет!
Меня зову Даниил, работаю Analytics Engineer в Сравни. Немного основной информации о себе и своем канале ⤵️

🏙 Родом из Соликамска, живу в Москве уже 7 лет с момента поступления в ВУЗ

🎓 Закончил бакалавриат и магистратуру в НИУ ВШЭ, из интересного успел съездить по обмену в Грецию "учиться" 😁
📚Инфокоммуникационные технологии и системы связи (бакалавр)
📚 Business Analytics and Big Data systems (магистратура на английском)

👨‍💻 В общем имею 5 лет опыта в аналитике, за это время сменил 3 компании
📍Леруа (System Analyst) ➡️ 📍EPAM (BI/DWH Analyst) ➡️ 📍Сравни (Analytics Engineer)

💼 На данный момент работаю на Lead позиции на проекте клиентской аналитики

✏️ Являюсь основателем образовательного проекта Data Study и автором курсов по аналитике данных, также автор данного канала и 2-х других
🔗 Data Вакансии - @data_vacancy
🔗 Книги по аналитике - @analyst_books

Также веду проектную активность в свое свободное время:
▪️ менторство и консультации
▪️ митапы и образовательные встречи для аналитиков компаний
▪️ консалтинговые проекты

В этом канале делюсь большим количеством полезного и бесплатного материала, как например эти посты:
🟣Дорожная карта аналитика данных
🟣Статьи по оконным функциям (часть 1 и часть 2)
🟣Исследование требуемых навыков в вакансиях data-специализаций
🟣Мок собесы на аналитиков
🟣Учебный проект по реализации платформы данных с нуля (часть 1, часть 2, часть 3)
Please open Telegram to view this post
VIEW IN TELEGRAM
33🔥19👍18
Аналитика данных / Data Study pinned «Привет! Меня зову Даниил, работаю Analytics Engineer в Сравни. Немного основной информации о себе и своем канале ⤵️ 🏙 Родом из Соликамска, живу в Москве уже 7 лет с момента поступления в ВУЗ 🎓 Закончил бакалавриат и магистратуру в НИУ ВШЭ, из интересного…»
Проголосуйте пожалуйста ☝️
Хочу собрать портрет своей аудитории, чтобы готовить более подходящий для вас контент)

Открыл комменты, можете под этим постом написать свою профессию если не нашли ее в списке 😉
👍10
☕️👨‍💻 А вы чем вечерами занимаетесь?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥7