Аналитика данных / Data Study
8.43K subscribers
405 photos
38 videos
24 files
327 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
У вас также, или я один от школьных времен отойти не могу? 😁

Думаю надо идти дальше учиться, второе высшее получать. Но правда тогда точно сентябрь будет с учетным годом связан)
😁249
Возле дома есть отличная набережная, где можно работать! Кстати у нас здесь 🦫 водится
🔥236👍2
Делюсь с вами новостями от ученицы о трудоустройстве!

Гера, выпускница 9 потока курса "Основы анализа данных", обучалась с марта по май в этом году. У Геры гуманитарное высшее образование (кто там думает что гуманитарии не могут попасть в IT? 😎), помогала вести финансы и CRM в маленькой юридической фирме.

Запрос на обучение был в систематизации и точечном расширении знаний по темам курса (SQL, Python, DWH, ETL, BI, Документация).

Сейчас Гера устроилась координатором по обеспечению поставок в крупную компанию с ЗП 90К 🥳👏

Из плюшек
🔹гибрид (удаленка + офис)
🔹ДМС
🔹возможность карьерного роста (в том числе в другие отделы и глубже в аналитику)

Давайте поздравим Геру с ее достижением!

А я напоминаю, что вы также можете поменять свой карьерный путь!

Жми сюда, учись и получай много полезных материалов 🧑‍💻

#кейс
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2913
Работа с NULL значениями в SQL

Часто бывает такое, что вместо явного значения данных в таблице попадаются NULL - "пустые" значения. И когда стоит задача отфильтровать данные, то у неопытных аналитиков и инженеров могут возникать сложности с такими пустыми значениями.

Почему так происходит?
В большинстве случаев фильтры пишутся с указанием явных значений в данных: конкретная строка/строки, число/числа, дата/даты

Например, найти заказы, в которых участвовали продукты с id 4, 7, 9
SELECT *
FROM orders
WHERE product_id IN (4,7,9)

Здесь все понятно. А если нужно наоборот исключить такие продукты из запроса?
SELECT *
FROM orders
WHERE product_id NOT IN (4,7,9)

Тоже вроде ок. НО если в таблице есть строки где product_id будет значением NULL, то такие строки не попадут ни в первый ни во второй запрос - а значит могут потеряться в аналитике совсем.

Помните про этот момент и не забывайте про конструкции IS NULL и IS NOT NULL - это фильтры, которые позволяют работать с пустыми значениями и не терять их в запросах.


Как еще можно работать с NULL: заменять их в явном виде на строку или любое нужное значение

Например, c помощью CASE
CASE WHEN product_id IS NULL THEN 'empty' ELSE product_id END AS product_id

Тогда дальше с этими значениями можно работать через обычный синтаксис фильтраций, не боясь забыть про NULL

Классно расписано про NULL еще в этой статье

Ну и не забывайте про COUNT(*), COUNT(column), COUNT(DISTINCT column), где NULL также учитывается по разному 🤓

👍 если пост полезен
👍478
Задался для себя таким вопросом 👇

Что лучше делать: усиливать и развивать и так сильную свою сторону или подтягивать отстающие навыки? Что даст больший эффект и рост в ближайшее время и что даст эффект на дальней дистанции?

Например, аналитик достаточно хорошо умеет писать SQL запросы, отлично преобразует данные и в формате таблицы может найти в них инсайты. Но к примеру он очень поверхностно знаком с BI и визуализацией и его отчеты могут больше запутать, чем подсветить выводы из данных.

Что ему делать
1️⃣ усиливать сильное - погружаться и специализироваться на подготовке данных с помощью SQL, углубляться в оптимизацию запросов, делать еще более сложные вещи запросами.
2️⃣ подтягивать слабое - изучать визуализацию, презентацию данных и сторителлинг
Что из этого даст ему больше выхлопа для роста в профессии? Какой подход выбрать для быстрого роста сейчас, а какой будет работать на долгий срок?

Что думаете? Пишите в комментариях 🧐
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓85
Как выглядит мой рабочий день (удалёнщика аналитика-инженера)

🕘 9:00 - просыпаюсь, умываюсь, завтракаю. никакой йоги, бассейна, утреннего зала, покупки раф-кофе 😁 или других полезностей нет)
раньше мог не завтракать и сесть через 10-15 минут после подъема сразу за ноутбук, но сейчас приучил себя полноценно завтракать.

🕙 10:00 - открываю ноут, начинаю читать чаты и составлять план работы на день

До 18 или 19:00 идет рабочий день
🔹2-3 часа в день в среднем уходит на созвоны
🔹5-6 часов на задачи и остальную коммуникацию в чатах

Перерыв на обед обычно плавающий, зависит от расписания созвонов и моего чувства голода)
Могу 3-4 раза за день пить чай/кофе и полноценно покушать 🍴

Сделал диаграмму, которая показывает какой % от всего рабочего времени в среднем в день я трачу на тот или иной тип задач и соответствующие инструменты 📊

бОльшая часть задач включает в себя написание SQL-запросов для создания витрин данных, adhoc-задач или запросов для автоматизации выгрузок. Также достаточно много времени уходит на коммуникацию, уточнение задач, приоритеты и разные тим-лид активности по планированию работы команды.

Здесь следует уточнить, что разделение рабочего времени на задачи и активности может сильно отличаться от
- роли аналитика (продуктовый, data, BI, аналитик-инженер...)
- типа и формата команды (у нас core команда клиентской аналитики, не привязанная к конкретному продукту)
- грейда аналитика (чем выше грейд, тем больше задач нужно делегировать и включаться в задачи команды)
- текущего планирования и приоритетов задач в рамках года/квартала/спринта

Я дал лично свою картину, часто на консультациях спрашивают чем именно я занимаюсь и как распределяется между этим рабочее время, вот расписал 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥249👍7
Чем я могу быть тебе полезен

Получил такой ценный совет 👇
На мой взгляд, на канале мало рекламы/информации о существующих продуктах. В том числе, ты не рассказываешь о своих сильных сторонах и экспертизе.
То есть, учебных материалов и курсов полно. Но может ты гуру а/б тестов? Если я хотел прокачать именно эту область, то пошел к тебе на курс.
Спасибо за канал и твой труд!

В связи с этим делюсь тем, в чем я могу быть полезен тебе и как со мной можно сотрудничать 👨‍💻

1️⃣Фундаментальные навыки аналитика и инженера данных

🔵 SQL
- от простых до комплексных SELECT запросов (джойны, агрегации, фильтры, логические функции само собой)
- оконные функции и работа с фреймами
- оптимизация запросов
- построение и автоматизация витрин данных

🔵 Python
- функциональное программирование
- написание ETL-пайплайнов
- библиотеки анализа данных

🔵 BI инструменты
- Сбор требований для BI проектов и разработки отчетов
- Работа в Datalens и Superset

🔵 Работа DWH, баз данных и ETL инструментов
- виды баз данных, когда и для каких задач применять
- различия OLAP и OLTP систем
- виды DWH и слои хранения данных

Все это я использую в своей повседневной работе уже много лет, обучил больше 100 человек, разработал несколько курсов. Обучаюсь постоянно сам и могу простыми и понятными словами объяснить тебе. Максимально только нужная информация и практика на примере решения аналитических задач.

Если хочешь учиться в группе с единомышленниками, приходи на курс "Основы анализа данных", группа с поддержкой и обратной связью начинает свое обучение в сентябре 🧑‍🎓
❗️❗️❗️ До этого обязательно пройди бесплатную часть курса

2️⃣Карьерная консультация

🔹со стороны оценить твои сильные и не очень стороны в формате интервью/собеседования
🔹разработать твой индивидуальный план развития для роста по грейду или перехода в другую роль (что и как учить, где взять материалы, как их закрепить)
🔹разобрать твое резюме и помочь переписать его для поиска работы

3️⃣Индивидуальное наставничество

🔹оцениваем твои навыки
🔹составляем план обучения под твои цели
🔹занимаемся на индивидуальных созвонах
🔹выполняешь ДЗ и практику, разбираем результат

Подводя итог, ты можешь выбрать
🔜 групповое обучение на моем курсе
🔜личные консультации и наставничество по твоему запросу

Вопросы всегда можешь написать в личку, открыт к общению
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥127👍6
Великие здания не стоят на зыбком фундаменте.

Как и устойчивые управленческие решения редко принимаются без фундаментальных знаний о менеджменте.

Потому мы и решили в Стратоплане предоставить всем бесплатный управленческий фундамент, чтобы вы построили свое «великое здание», а именно — управленческую карьеру. Также постараемся сделать так, чтобы в конце была ясность: это действительно то, чего вы хотите?

Что будет на нашем проекте «Management Foundation»:

— Ассессмент: узнаете, где ваши сильные и слабые зоны, как руководителя
— Эфиры с кейсами и разговоры с практиками: разбираем кейс, пробуем управленческие решения; разбираем сложные темы с теми, кто преуспел в управлении
— Практичные лонгриды: полезное управленческое чтиво с инструментами и инсайтами от опытных руководителей

Бесплатная регистрация на Management Foundation:
https://stratoplan-school.com/foundation/datastudy

📅 Когда: 1–19 сентября 2025, абсолютно бесплатно

Спойлер👇

На foundation разберем три темы:

— «Я менеджер: что это значит на практике» — про ловушки первых шагов в менеджменте
— «Почему с вами никто не договаривается» — какие ошибки чаще всего мешают договариваться
— «Менеджер в системе без самой системы» — как не жить в пожарном режиме и успевать главное.


А еще помимо Стратоплана будут те, кого вы, возможно, читаете или слушаете в Telegram, а именно авторы: «Тимлид Очевидность», «Кода Кода», «Чужими руками», «System Design & Highload», «LinkedIn & Career» и другие...

📏 1-го сентября встречаемся на бесплатном проекте Стратоплана «Management Foundation» здесь
👍17🔥65
Написал статью на Habr про построение потока данных с serverless технологиями в облаке

Собрал там информацию о реальном примере работы с excel/csv файлами, когда есть потребность загружать данные из них в базу данных для хранения и анализа. В статье расписал как использую

🔹Object Storage
🔹Managed Service PostgreSQL
🔹Cloud Functions
🔹Cloud Triggers

Довольно подробная инструкция, можно все максимально повторить по шагам

Статья, буду рад вашей поддержке 😉
👍8🔥52