Аналитика данных / Data Study
8.49K subscribers
404 photos
38 videos
24 files
330 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
😂😂😂 когда-то все были новичками и все чувствовали тоже самое
😁30🔥6
Мысли про удалёнку

Поделюсь опять мыслями про работу из дома. Минусов много...
1. Рабочее кресло всегда занято кошкой
Поэтому нас формат open space - каждый работает где свободно)

2. Вкусная пекарня в доме
Да и в целом близость к холодильнику всегда манит попить чаёк со вкусняшками 😬

Если серьезно, то я безумно рад что работаю на удалёнке

В Москве в среднем на дорогу дом-офис-дом уходит 2-2,5 часа ‼️
еще время на сборы
час-пик, пробки, суета
погодные условия не всегда приятны

Если грубо посчитать:
20 рабочих дней * 3 часа в пути = 60 часов в месяц может просто уходить на дорогу ‼️

Если эти 60 часов тратить на полезные задачи и фриланс, то можно уже хороший доход получить. К примеру, на биржах фриланса точно есть довольно простые для новичков заказы. Стоимость либо договорная за всю работу, либо посчитаем по низкой ставке 1000 руб./час

60 тыс. ₽ - это потенциальный доход, который просто заложен в том времени, тратящимся на дорогу до офиса.
Ну или если не хотим работать, значит тратим время на свои увлечения.

Поэтому многие и пишут мне, что хотят сменить профессию ради такой свободы. Свободы распоряжаться временем самостоятельно, ведь это главный наш ресурс
17👍12
Кстати, хочу напомнить, что сегодня последний день, когда можно купить курс по старой цене

Основы анализа данных - 25 000 рублей

✏️ Кто хочет, но есть сомнения подойдет ли вам курс по вашему конкретному запросу, пишите лично мне, разберем и обсудим.

Подробнее про курс здесь и на сайте datastudy.ru
👍4
Must have для документации работы

Год назад после блокировки Atlassian тулов стал искать альтернативу, что также удобно можно использовать для ведения своих личных заметок, документации собственных проектов и т.д.

Выбор пал на Notion - мощный инструмент в формате wiki-системы (создание разделов, страниц, заметок, чек-листов, канбан-досок и т.п.)
Туда еще по всем канонам современной моды добавили AI-движок (Notion AI), который за тебя может писать доку, исправлять уже написанный текст, менять формат с одного на другой. В общем, кажется что digital-командам это может помочь увеличить эффективность работы с документацией. Для индивидуального использования Notion бесплатен, что очень приятно) Для работы команд есть свой pricing.

У них на YouTube-канале есть куча полезных и коротких видео по функционалу, можно посмотреть кому интересно)
👍12🔥1
Всем привет!

Давно не выходил здесь на связь, очень много активностей происходит, было трудно найти время на написание контента. Буду потихоньку вливаться опять в ритм публикации постов.

Неделю назад проводил мок-интервью на позицию BI-аналитика в прямом эфире вместе с Solvery. На мой взгляд получилось интересно, для людей присматривающихся к области BI будет полезно посмотреть и зафиксировать себе ответы и вопросы с интервью.
Вообще всю прошлую неделю были эфиры по разным направлениям аналитики:
- BI
- Продуктовая
- Системная
- Big Data

Собеседования проводили разные эксперты для кандидатов уровня junior

Прикрепляю ссылки на записи эфиров ⬇️

📍Моковое собеседование Junior BI-аналитик | Даниил Джепаров, Senior BI Analyst, RNT Group

📍Моковое собеседование Junior Бизнес-аналитика | Ольга Мазур, Head of Business Analysis, Samokat.tech

📍Моковое собеседование на позицию Junior Системного аналитика | Наталья Золотова, Ведущий системный аналитик

📍Моковое собеседование на позицию Junior Data Analyst | Дмитрий Лапин, DA/DS Team Lead, JSA Group
🔥18👍42
Классная штука, которую можно применять, если нужен поток из множества шагов обработки данных
Forwarded from Data Secrets
Про pipe в pandas

pipe - это метод реализации паплайна в pandas через последовательную цепочку преобразований (не путать с Pipeline из скалерна).

Например, у нас есть ряд функций, каждая из которых отвечает за какое-то преобразование. Тогда пайплайн в pandas можно реализовать так:

def normilize(df):
...
return df

def fill_null(df, method):
...
return df

def parse_time(df):
...
return df

new_df = (df
.pipe(normilize)
.pipe(fill_null, method='median')
.pipe(parse_time)
)

😻 #preprocessing
Please open Telegram to view this post
VIEW IN TELEGRAM
👍231
Привет!

Я знаю что много кто из вас проходил курсы в онлайн-школах. У меня для вас новость ⤵️

Выпускница вышки сейчас пишет диплом про образовательные онлайн-платформы. Диплом по направлению "реклама и связи с общественностью", поэтому для хорошего и качественного исследования нужны респонденты

Если
- вы старше 18 лет
- проходили курсы на любой из платформ: Skillbox, Skillfactory, Нетология, Geekbrains, Яндекс. Практикум

Пройдите опрос по ссылке
Я прошел, он у меня занял буквально 5 минут 😉

Сейчас пройдете опрос, а я потом попрошу выпускницу сделать краткие выводы по исследованию и поделюсь ими здесь. Интересно посмотреть, что в итоге получится)

Пройти опрос
👍52🔥2
Сравнение Data Scientist, Data Engineer, ML Engineer, Data Analyst

В целом по визуализации понятно, кто из специалистов в каком направлении больше работает. Правда на таких диаграммах сложно оценить какие более детальные навыки нужны и на каком уровне их нужно освоить, чтобы например из Data Analyst перейти в Data Scientist
👍31🔥6
На этой неделе защитил магистерский диплом 🎉🎉🎉
Теперь можно сказать, что 6 лет обучения и 2 ступени образования пройдены)

Бакалавриат - Инфокоммуникационные системы и сети
Магистратура - Бизнес-аналитика и системы больших данных
Все это в замечательном НИУ ВШЭ

По ощущениям учебы в магистратуре могу сказать что это довольно сложно совмещать полноценное обучение с работой, разработкой/ведением курсов. Магистратура была на международной программе, поэтому все обучение проходило на английском, это позволяло поддерживать язык в активном использовании. Учеба была вечерняя, т.е. с 18:00 до 21:00, вроде удобно совмещать с работой, но обычно сил на учебу уже и не оставалось.

В целом, по форме образования могу сказать, что курсы от академических преподавателей сильно далеко находятся от реальных знаний и практики на работе. Теории много, а что и как применить - не всегда становится понятно. Также было много курсов от преподавателей - приглашенных практиков, обычно это Senior/Lead/Head of department уровень специалисты, которые часто раскрывали прикладные вещи, которые можно применять у себя на работе. Формат курсов от практиков мне прям понравился.

Дальше выбор: почувствовать в этом году первый раз, что сентябрь - это всего лишь начало осени, а не начало учебного года 😂, либо идти в аспирантуру)
🎉83🔥6👍53
На этой неделе провели 3 технических интервью для кандидатов в компанию. Ещё раз убеждаюсь, что для аналитика, работающего с данными важны как hard навыки работы с данными, так и знания классического бизнес-анализа по работе со стейкхолдерами, требованиями и понимание всех фаз SDLC цикла.

Если готовитесь к собесам на позицию аналитика данных/BI, углубляйтесь как минимум в 2 направления:

1. Бизнес-анализ
- работа со стейкхолдерами
- проведение интервью, воркшопов, оценка требований
- формирование и декомпозиция требований

2. Работа с данными
- понимание ценности применения баз данных и хранилищ данных для бизнеса, где, когда и что лучше применять, зачем использовать
- Модели данных, нормализация, SCD
- SQL
- Python
- ETL инструментарий и в принципе понимание шагов обработки данных по слоям (от сырых данных к витринам)
- Метрики качества данных
- Написание интеграционной документации и описание потоков данных
- BI и визуализация данных

+ про мат часть, статистику, теор. вероятности и ML не забывать, если на проекты с ML именно есть желание попасть
👍31🔥53
Если я вам когда-нибудь скажу как же замечательно работать дома - не верьте!

Сбежал из дома в кофейню из-за ремонта соседей. Живем в новостройке вроде как бизнес-класса, но такое чувство, что про шумоизоляцию при строительстве новых домов вообще не задумываются вне зависимости от класса жилья. Ремонт делают соседи на этаже вообще в другом крыле за лифтом, это даже не соседняя квартира, но слышно как будто в соседней комнате перфоратор работает.

В итоге убежал в кофейню, где частенько в последнее время спасаюсь от ремонтных будней, но и здесь раз на раз не приходится) Сегодня сюда пришла девушка с 2-мя маленькими девочками возраста начальной школы, которые не ладят между собой. В итоге их крики, ссоры и разборки кто кого достал слушают все посетители кофейни. При этом девушка сама пытается работать в ноутбуке и не отвлекаться на детей, которые ее дергают вопросами типа "кто лучше умеет заворачивать язык в трубочку"

В такие моменты хочется реально поехать в офис с тихими коворкингами и изолированными переговорками для проведения встреч. Ну или уехать в загородный дом с камином работать, а вечером жарить шашлык и залипать на природу на берегу реки 😍
👍37🔥11🥰32
Чем занимается DWH аналитик

Вы наверно видели на сайтах вакансии с названием "DWH аналитик". Однако не всегда понятно чем вообще предстоит заниматься в компании на такой позиции. Давайте разберемся, какие основные задачи обычно закладываются в такую позицию и какие навыки для этого нужны.

🔎 DWH (Data Warehouse) - аналитическое хранилище данных. Т.е. это комплексная система (или ряд систем), которые обеспечивают хранение, сбор, преобразование и подготовку данных для анализа.

Аналитики в этом процессе МНОГО, ее можно разбить по задачам (или направлениям задач)

1. Поиск и определение источников данных

Источниками данных выступают базы данных систем, которые используются в компании. А также в качестве источника могут быть простые файлы от бизнеса, которые в каком-то (скорее табличном) виде нужно положить в хранилище.
К примеру, может понадобиться найти систему источник с данными о логистических запасах компании. При этом отдел логистики может использовать несколько разных систем. Аналитику DWH нужно будет выяснить в какой базе данных какой системы хранятся нужные нам данные. А также нужно будет зафиксировать и описать способ сбора этих данных.

2. Описание требований для сбора, преобразования данных

Помимо того что аналитик должен узнать и раскопать где лежат нужные данные, необходимо ещё продумать логику как эти данные забирать:
- забирать все или только часть данных
- забирать по какому-то триггеру или по расписанию
- как часто забирать (раз в час, 2 раза в день, раз в сутки…)
- в какое время забирать данные, чтобы не нагружать систему, но чтобы данные попали к бизнес-пользователю и отчеты вовремя

Все это необходимо обсудить с командой бизнеса, командой разработки и задокументировать в технической спецификации

Это только часть работы, которой может заниматься аналитик на проектах с DWH. В отдельном посте распишу другие задачи, которые встречаются на проектах, а также обозначу навыки, которые для это позиции нужны.
👍22🔥9
В понедельник провел последнее занятие - защиту проектов по модулю SQL как приглашенный преподаватель в одной из онлайн-школ. Обратная связь от учеников положительная, много классных проектов для портфолио было сделано. Фотка так себе по качеству, но хотелось в очередной раз зафиксировать момент)

А самое главное - сейчас ребята умеют работать с SQL и решать с помощью него различные задачи. За 6 занятий прошли

1. Моделирование данных, ER-диаграммы
2. SELECT запросы, условия фильтрации, логические/арифметические функции, функции работы с датами, временем и строками
3. JOINs
4. Подзапросы и табличные выражения
5. Оконные функции, фреймы оконных функций
6. Работа с индексами, оптимизация запросов и работа с планом выполнения запроса

Лет 5 назад не думал, что буду преподавать другим 😁 Но сейчас видны результаты учеников и я этому очень рад, скорее всего с кем-то в будущем будем на одних проектах работать)
🔥29👍12
Когда недооценил трудозатраты на задачу 😅
🔥70😁152
Теперь официально магистр 👨‍🎓😁
🎉114👍129🔥6
😂😂😂
кстати ученики 35+ очень ответственно относятся к обучению и очень много материала сами пытаются раскопать 👍
😁56👍116🎉1
Еще одно прекрасное событие
👰‍♀️🤵‍♂️💍
🎉13218👍4🔥4