Аналитика данных / Data Study
8.49K subscribers
404 photos
38 videos
24 files
331 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
Подписчик написал такой вопрос:
«как можно оцифровать бизнес помимо внедрения 1C и CRM системы?»

Давайте разберём что такое цифровизация.
🔎 Цифровизация бизнеса - это процесс интеграции технологий, продуктов и услуг, основанных на цифровых технологиях, для улучшения эффективности работы компании, увеличения производительности, уменьшения затрат и увеличения прибыли.

Другими словами, это процесс внедрения IT систем на благо компании.

Например, компания продаёт велосипеды в своих розничных магазинах. Руководство хочет открыть онлайн канал продаж.

Что можно предложить в качестве решений и развития бизнес-процессов:
1. Создать свой сайт
2. Интегрироваться на маркетплейсы
3. Интегрировать продажи в мессенджеры
4. Начать собирать данные и развить онлайн-маркетинг с рассылками
5. Сделать отчётность на дашбордах
И много чего ещё

На курсе по бизнес-анализу мы разбираем подобные кейсы.

📍учимся выявлять и формировать требования
📍описываем бизнес-процессы AS-IS и TO-BE
📍создаём задачи на разработку
📍разбиваем проект на этапы

Главный результат - умение создавать структурированную и понятную документацию

Для закрепления навыков ученики решают кейс про цифровизацию кинотеатра

21 февраля старт обучения на курсе Бизнес-анализ в IT

С подробной информацией о курсе и программой можно ознакомиться на сайте https://datastudy.ru/2

Для знакомства с планом обучения думаю записать открытый урок, чтобы рассказать детали про процесс обучения.

Ставьте реакции, если нравится идея с открытым уроком. Будет полезная теория и инсайты с рабочих проектов 😉
🔥8😁2👍1
Формат обучения на курсе "Бизнес-анализ в IT"

Я сам проходил множество курсов и обучался в университете, поэтому я понимаю как важен выбранный формат обучения для успешного освоения материала.

Какой баланс между теорией и практикой
Занятия построены и распределены таким образом, что отношение получается 50% теория и 50% практика. Это учитываются именно занятия. Еще не забываем про домашние задания и самостоятельную работу над итоговым проектом. В итоге, у учеников получается 30% теории и 70% обучения на практике.

Какая последовательность изучения материала
- во время занятия идем от простого к сложному (с обсуждением практического опыта моего и учеников)
- обучение разбито на блоки: теоретическое занятие - практическое занятие - самостоятельное закрепление при выполнении ДЗ и итогового проекта. Дальше переход к новой теме и цикл повторяется 🌀
- темы идут согласно реальному процессу работы на проекте: начинаем с бизнес-цели и описания AS-IS, далее пользовательские/функциональные/нефункциональные требования, постановка задач, показ плана проекта и документации заказчику

Какие инструменты используем во время курса
📍Miro для закрепления плана уроков, обсуждения общего кейса и формирования идей решения
📍Notion для работы с документацией (также смотрим с учениками работу в Jira/Confluence)
📍drawio/Lucidchart для моделирования диаграмм бизнес-процессов

Какие контрольные точки есть на курсе
Каждый ученик должен будет пройти несколько этапов работы над практическими кейсами
1️⃣ Интервью с заказчиком (я выступаю в роли заказчика, ученики в роли аналитиков задают вопросы и учатся выявлять требования)
2️⃣ Сдача подготовленных требований (бизнес, функциональные/нефункциональные, use-кейсы)
3️⃣ Защита кейса (показ презентации как на демо-сессии заказчику: я в роли заказчика, ученики - аналитики)

Будут ли доступны записи занятий
Ученикам остаются доступны все записи уроков навсегда. Если кто-то пропускает занятие - смотрит запись и не отстает от группы обучения.

Кто ведет уроки и сколько человек в группе
Максимальное число учеников в группе - 15 человек. Уроки веду я, обратную связь даю тоже я.

Набор в группу на обучение уже идет 😉

Начинаем обучение 21 февраля

Время занятий:
Вторник: 19:00 по мск
Суббота: 10:00 по мск
👍51
Хранилища данных, требования к хранилищам, их отличия от реляционных БД

"Информационные системы масштаба предприятия, как правило, содержат приложения, предназначенные для комплексного многомерного анализа данных, их динамики, тенденций и т.п. Такой анализ в конечном итоге призван содействовать принятию решений. Нередко эти системы так и называются — системы поддержки принятия решений."

Ссылка
👍7
Разница между Agile и Waterfall

Наверняка вы слышали про разные методологии проектной деятельности, а про Agile я уже писал отдельный пост, будет полезно его почитать.

Сегодня разберем в чем разница между Agile и Waterfall. Вот что на этот вопрос ответил ChatGPT:

"Agile and Waterfall are two different approaches to software development. Agile is a more iterative approach that focuses on delivering small chunks of working software quickly, while Waterfall is a more traditional approach that follows a linear sequence of steps and focuses on delivering the entire project at once. Agile emphasizes collaboration between team members, while Waterfall emphasizes individual responsibility and clear documentation. Agile also encourages frequent feedback from stakeholders and customers, while Waterfall focuses more on planning upfront."

Другими словами, Agile необходим для итеративной работы над задачами и кусочками функционала, чтобы предоставлять более частые релизы до пользователей и собирать от них обратную связь.
Это дает:
📍 возможность изменять/выявлять новые требования
📍выкатывать новый функционал чаще
📍быстрее получать обратную связь и выявлять баги/ошибки/недочеты чаще
📍совместную работу всех членов команды и высокую взаимозаменяемость (если все идеально сложилось 😁)
📍для небольших команд разработки

Waterfall описывает работу на проектам по стадиям, которые должны идти одна за другой линейно, либо частично пересекаясь. Как и когда удобно работать по Waterfall:
📍есть четко оформленное ТЗ с проектной документацией, которые не должны сильно меняться в процессе проекта
📍результат проекта будет виден только на конечной стадии
📍waterfall не подразумевает частые релизы и внесения изменений в функционал
📍обратная связь от пользователей будет получаться редко
📍если проект не сильно длинный (до 3 месяцев), либо наоборот очень долгоиграющий (туго идущий так сказать 😄)
📍если над проектом работают большая распределенная команда (но здесь также есть вариант разбить на несколько команд и сделать в каждой команде отдельный Agile)


Методологии работы над проектами важны для понимания и изучения, чтобы быстро вливаться в проекты, команды и чувствовать себя в своей тарелке, и чтобы не уточнять у коллег "что такое workflow", "зачем нужна jira" или "почему мы не запускаем спринты для нашей kanban доски" 😁😁😁

На курсе "Бизнес-анализ в IT" мы подробно изучаем различные методологии и обсуждаем моменты работы по каждой из них.

Напоминаю, записаться на курс можно на сайте datastudy.ru
➡️ Старт обучения уже скоро: 21 февраля
🔥8👍21
Супер-полезные материалы по бизнес-анализу и работы с требованиями (Часть 2)

Эта вторая часть поста с полезными ресурсами по БА, первый пост можете почитать здесь

Несколько полезных ресурсов про разбор работы с требованиями:

1. Требования к ПО на пальцах
Простыми словами и в картинках рассказан путь по выявлению требований:
Зачем мы их выявляем? (про цель)
Что мы выявляем? (as-is и to-be состояния)
Как мы это делаем? (декомпозиция бизнес ➡️ пользователь ➡️ система)
Когда? (приоритезация и структурирование)

2. Пример написания функциональных требований к Enterprise-системе
Статья содержит очень много полезных определений из бизнес-анализа, а также автор описывает на примере проекта используемую структуру работы с требованиями
📍Бизнес-требования
— Общие сценарии
— Сценарии использования
— Алгоритмы и проверки
📍Системные требования
📍Нефункциональные требования
📍Требования к интеграции
📍Требования к пользовательскому интерфейсу

3. Как писать требования чтобы их понимали
Очень доступные и верные правила написания требований для упрощения работы с ними. Я обобщил их для себя в 3 тезиса:
1️⃣ Пишите просто - максимально упрощаем понимание, пишем тезисно и разбиваем составные требования на разные требования
2️⃣ Используем таблицы, списки, форматирование для структурирования требований - не пишем сплошным текстом
3️⃣ Визуализируем требования в схемах - сами схемы также не перегружаем лишним текстом, используем подходящие нотации (BPMN, UML, блок-схемы)

Дальше поделюсь полезными ссылками и ресурсами про международную сертификацию по бизнес-анализу

1. Международный Институт Бизнес-анализа (IIBA)
На сайте есть множество информации о международных стандартах бизнес-анализа, информацию про разные виды и уровни сертификации. Это самые престижные сертификаты международного уровня в области бизнес-аналитики.
Certified Business Analysis Professional (CBAP) - самый высокий по уровню и сложный в получении сертификат по БА
Certification in Business Data Analytics - сертификация в области аналитики данных и business intelligence

2. Уровни сертификации по бизнес-анализу до получения CBAP
Для понимания, CBAP и другие сертификации построены на основе книги BABOK, которой делился в предыдущем посте. Это свод знаний, на который стоит ориентироваться в первую очередь. В статье описаны уровни сертификации:
1️⃣ ECBA (Entry Certificate in Business Analysis) - знание основных понятий по бизнес-анализу
2️⃣ CCBA (Certification of Capability in Business Analysis) - знания + практический опыт 2-3 года
3️⃣ CBAP (Certified Business Analysis Professional) - проштудировать несколько раз BABOK от корки до корки и проработать ~ 5 лет в роли аналитика
Оценки опыта конечно сильно зависят от кандидата, проекта и реальных задач, которые он выполняет. Часто за год можно получить богатейший опыт, который другие и за 7 лет не получают 🙂

3. Project Management Institute
Еще один международный институт, который также предлагает сертификацию по бизнес-анализу. Про сам сертификат PMI Professional in Business Analysis (PMI-PBA) и процесс сдачи можно почитать здесь

Зачем нужны международные сертификаты?
- если вы хотите подтвердить свою экспертность на международном уровне
- если хотите найти отличный оффер в международной компании (без сертификата тоже можно, но с ним у вас будет больше возможностей)
- если хотите стать спикером на международных конференциях или ментором в крупных компаниях
- если работаете в области консалтинга и предоставляете свои услуги в роли бизнес-консультанта

На курсе мы учимся применять на кейсах практики, описанные на международном уровне. Это может стать вашим первым шагом в развитии крутой карьеры аналитика 😉
➡️ Записаться на курс

Ставьте реакции, если пост для вас полезен) Набираем 70 🔥🔥🔥 и готовлю 3-ю часть с полезными ресурсами для аналитиков
🔥29👍2
Привет!
Задеплоил своего первого бота ещё неделю назад. Вроде пока пользовался косяков не выскакивало)

Основные функции:
1. Удобный доступ к ресурсам Data Study
2. Запись на личные консультации
3. Карманный ChatGPT. Просто пишите свои запросы в чат с ботом, он будет формировать на них ответ с помощью API от OpenAI. Глубоко не изучал вопрос, возможно в скроем времени вылезет лимит на запросы 😃, тогда буду разбираться что с этим можно сделать)

Вообщем, надеюсь бот будет уже сейчас вам полезен. В будущем буду добавлять функционал, например подписка на получение интересующих вакансий, викторины по аналитике и т.п.

➡️ Начать пользоваться @data_study_bot

P.S. Если заметите сбои/баги, либо просто будут классные идеи по дальнейшему развитию бота, пишите, буду благодарен 😉
🔥10👍1
Старт обучения "Бизнес-анализ в IT"

Уже завтра начинается обучение на моем курсе "Бизнес-анализ в IT"

Для кого подходит курс:
📍Специалистам из разных отраслей, кто переходит в IT
📍Нетехническим специалистам: менеджеры, руководители, владельцы продуктов
📍Техническим специалистам: разработчики, QA-инженеры, системные инженеры
📍Начинающим аналитикам: бизнес, системные, data, BI, продуктовые

Формат обучения
➡️ Маленькая группа до 10 человек
➡️ Занятия 2 раза в неделю (вторник 19:00, суббота 10:00 мск)
➡️ Теоретические занятия (50%) + Практические занятия (50%) + Индивидуальный проект для портфолио
➡️ общение в telegram, живые созвоны занятий + созвоны вопрос/ответ
➡️ личная обратная связь от меня каждому ученику

Программа курса по блокам
1️⃣ Работа со стейкхолдерами (вовлечение, виды и приемы коммуникации, методики проведения интервью и опросов)
2️⃣ Работа с бизнес-требованиями (иерархия требований, постановка целей по SMART, шаблоны формирования требований и потребностей)
3️⃣ Пользовательские требования (use cases, user story, мокапы/прототипы, шаблоны документации)
4️⃣ Системные требования (функциональные, нефункциональные, правила оформления)
5️⃣ Диаграммы бизнес-процессов (контекстные диаграммы, функциональные диаграммы, блок-схемы, UML-диаграммы, BPMN-диаграммы)
6️⃣ Навыки визуальной презентации + навыки прохождения и подготовки к интервью
7️⃣ Методологии проектной деятельности (Waterfall, Agile, Scrum, Kanban, приоритезация задач)
8️⃣ Навыки коммуникации в команде и решение конфликтных ситуаций
9️⃣ Оформление резюме

каждая тема закрепляется практическим занятием
выполнение итогового проекта (решение бизнес-кейса с проведением интервью и итоговой презентацией)

Какие результаты получаете
умеете работать с разными видами требований (бизнес, пользовательские, системные)
умеете выявлять цели и задачи проекта, общаться со стейкхолдерами и составлять план проекта
умеете работать с разными методологиями разработки
умеете моделировать бизнес-процессы в разных нотациях
умеете готовиться к интервью на работу и проходить его без паники, подчеркивать свои сильные стороны
имеете грамотно оформленное резюме, готовое для отправки работодателям

Все материалы курса остаются у вас навсегда, к ним можете вернуться в любое время
Это последний запуск курса с моим полным вовлечением по такой цене, дальше условия и цена будет меняться

Старт занятий:
завтра 21 февраля в 19:00 по мск
🔥7👍4
Открытый урок курса "Бизнес-анализ в IT"

Рассказываю
1. Кто такой бизнес-аналитик
2. Почему бизнес-анализ востребован в IT
3. Компетенции востребованного аналитика
4. Задачи, решаемые аналитиками
5. Обзор рынка вакансий и статистика
6. Как получить необходимые навыки и получить работу

Смотреть урок
🔥8👍1
Статья про DevOps практики для построения хранилищ данных

Хоть DevOps и не моя прямая обязанность на проектах, но знаю что понимание всего технического процесса в целом очень сильно упрощает работу на проекте, особенно когда нужно отвечать на вопросы заказчиков "а как это у вас реализовано?"
Поэтому рекомендую читать статьи из смежных отраслей вашей профессии также 😉

Читать статью
🔥5👍2
DBT - инструмент для трансформации данных

DBT (Data Build Tool) - это открытый инструмент для трансформации и анализа данных. DBT помогает разработчикам, аналитикам, специалистам по BI строить потоки данных и описывать процесс трансформации с помощью SQL запросов

Полезные ссылки по инструменту:

1. dbt Documentation: https://docs.getdbt.com/
2. dbt Tutorials: https://discourse.getdbt.com/c/tutorials
3. dbt Course on DataCamp: https://www.datacamp.com/courses/building-data-pipelines-with-dbt
4. dbt Slack Community: https://slackin-dbtcommunity.herokuapp.com/
5. dbt YouTube Channel: https://www.youtube.com/channel/UCmX_KVQnjFvxCxGwLJb4qKg
6. dbt Blog: https://www.getdbt.com/blog-posts
5👍4
Как ваши выходные проходят? 😃

Ездили в домик на природу, к ноутбуку подходил только 1 день из 4, это достижение 😅

Накидайте 🔥 если в выходные получилось отдохнуть
🔥43👍2
Привет!

Делюсь ссылкой на полезные упражнения по библиотеке pandas для работы с данными

Ссылка на упражнения

Есть ещё вот такой замечательный сайт pandaspractice.com с упражнениями и примерами. Подойдёт для новичков, кто только начинает знакомство с функционалом библиотеки.

Pandas Practice
16🔥8👍4
Все больше погружаюсь в область Data Governance и Data Marketplace, потому что это сильные инструменты для получения из данных ценности в масштабе корпораций.
Сейчас исследую тему каталогов данных (Data Catalog). Главный вопрос - Зачем они нужны?
Некое summary

📍Data Discovery: Data catalogs provide a central repository for all enterprise data, making it easier to discover and locate relevant data sources.

📍Metadata Management: Data catalogs provide a platform to store and manage metadata associated with each data source, such as the source of the data, its format, and any other relevant information about the data.

📍Data Governance: Data catalogs provide an effective way to manage access control lists and keep track of who has access to what data. This helps organizations to protect sensitive data.

📍Quality Assurance: Data catalogs allow organizations to easily monitor the quality of their data sources by providing visibility into any errors or inconsistencies in the underlying datasets.
👍8🔥3
Много у нас здесь студентов? Накидайте свои реакции 😉
😁45🔥9👍6🎉1
На многих курсах в университете нам рассказывали про алгоритмы машинного обучения, все одно и то же: регрессия, кластеризация, классификация.
На одном из курсов нам показали процесс построения ML-пайплайнов на очень простом и интуитивно понятном low-code решении Orange. Вещь реально классная, где можно с помощью drag and drop мышкой построить довольно замудреный процесс обработки данных, да еще и с применением ML, а в конце визуализировать результаты. Для учебных задач вообще 🔥. Естественно т.к. это готовый инструмент, есть свои ограничения по сравнению написания кода для работы с данными с нуля, для моделей доступно ограниченное количество параметров для настройки, зато красиво и интересно 😁

Orange Data Mining
👍19
Офис в Москва-Сити - престижно или нет?

Сегодня ездил в один из офисов Москва-Сити по вопросу документов по ИП. Поймал себя на мысли, что я бы не хотел ездить туда работать каждый день. Выделил 2 момента:
1. Очень большая суета вокруг, больше чем в других местах Москвы
2. Чувствуется лишняя напыщенность людей (явно не все такие, но сегодня я по большей части контактировал с такими)

Я никого не хочу сейчас обидеть или сказать, что так только в Москва-Сити. Это сегодняшнее мое наблюдение.
Еще интересный момент, что HR любят писать в сообщениях и указывать в вакансиях, что у компании офис в башнях. Для компании может это и круто, статусно, но это никак не влияет на статусность самой вакансии, разве что это хорошее уточнение про местоположение офиса для кандидата)
Почему-то сложилось вокруг мнение, что если человек работает в Москва-Сити, то он автоматически успешен все у него хорошо в карьере. При этом мало кто задаст второй вопрос: а кем ты там работаешь? Работа как и везде разная, начиная от дворников и заканчивая генеральными директорами.

В общем, для себя я понял 2 вещи:
1. Меня не цепляют вакансии, которые хотят удивить или заманить кандидата шикарным офисом (лучше пусть пишут про 100% удаленку и гибрид по желанию 😃)
2. Для меня важна тишина и комфорт в рабочем пространстве, а еще лучше когда это будет воплощено в доступности с природой. Только представьте: веранда, солнышко, птички поют, речка в пешей доступности, тишина, и при этом работает безлимитный скоростной Интернет 🥹😍
👍5734🥰25🔥20
На днях познакомился с библиотекой geopandas для работы с различными форматами геоданных и дальнейшей геоаланилитики над ними

🔎 geopandas - библиотека Python для работы с географическими данными. Она позволяет работатьс раличными стандартными файлами для записи геоданных: shape-файлами, GeoJSON-данными, KML-файлами, GeoPandas DataFrames и PostGIS. Есть множество функций для работы с точками координат, форматам данных полигонам и мультиполигон (области на карте). Соответственно все функции pandas для привычных типов данных совместимы. Доступна различная визуализация карт.

Для установки: pip install geopandas

Документация
👍13🔥5
Поздравляю всех девушке с международным женским днём!🌷🌷🌷

Любите и будьте любимы 😉💐
27
Самый важный навык для аналитика

Подумал на днях что чаще всего я использую в работе и без чего не обходится мой рабочий процесс. Понял, что я каждый день использую SQL в своих задачах.
Напомню, что позиция моя называется BI Analyst, здесь Business Intelligence в явном виде означает что на проектах я выполняю роль как бизнес-аналитика, так и data-аналитика. Узнал потребность бизнеса -> Подготовил требования -> Исследовал данные и подготовил ТЗ -> Передал задачи инженеру данных.

SQL для меня является универсальным инструментом, без которого невозможно работать на проектах по разработке хранилищ данных и внедрению аналитических BI-решений.
📍Первичное исследование структуры данных
📍Проверка качества данных
📍Написание бизнес-правил обработки данных
📍Подготовка витрин данных для визуализации
📍Ad-hoc запросы по расчету метрик
📍Валидация результатов визуализации

Все это делаю с помощью SQL, а уже к нему дополнительно применяю BI тулы с визуализацией, Python.
Не зря SQL сейчас встречается почти в каждой вакансии для аналитиков, без его знания вам будет туго. Поэтому считаю, что первым делом при обучении важно освоить теорию баз данных и хранилищ, изучить SQL на уверенном уровне, дальше уже нарабатывать другие навыки. Также важно правильно работать с требованиями и оформлять их в корректном и понятном виде, с применением общепринятых стандартов.
Думаю, что свои курсы дальше буду еще больше углублять в эти навыки, потому что это действительно важно на работе для учеников + мне это очень нравится 😍
🔥24👍124
This media is not supported in your browser
VIEW IN TELEGRAM
Попробовал сегодня поработать с pygwalker, библиотека Python для визуализации данных с удобным интерфейсом, очень схожим с Tableau.

Для быстрой визуализации результатов преобразований и анализа вообще супер! Всегда было запарно писать код для matplotlib или других визуалок, бывало что проще выгрузить sample данных в файлик и пойти повизуализировать в BI инструменте. Сейчас BI приехал прямо в Jupyter Notebook 🔥🔥🔥

Буду смотреть детально особенности и возможности библиотеки, уверен на курсах с учениками познакомимся с ней и будем применять в задачках 😃

Ссылка на описание pygwalker
🔥28👍1
Привет!
В последние дни много активностей происходит в жизни, даже некогда написать пост с интересными материалами. Немного распишу чем сейчас занимаюсь и сделаю несколько объявлений.

1. Закончил вести курс по SQL в одной из онлайн-школ. Ученики защитили итоговые проекты, получили от меня комментарии по работам (в основном положительные) и обратную связь, в ответ дали мне также положительный фидбэк за мою работу 😊

2. Разрабатываю материалы для другой онлайн-школы по курсу SQL. Там формат записи видео, для меня будет новый опыт. Материалов и идей куча, сейчас идет активная работа с точки зрения методологии. ✏️✏️✏️

3. На работе закончилась первая стадия проекта по разработке аналитической платформы. Сейчас переходим ко второй стадии, подключаем новые источники, берем в разработку новые витрины и дашборды 👨‍💻

4. Готовлю доработки по материалам и практике для курса "Основы анализа данных". Определился с началом обучения следующего потока - 16 мая . В таблице предзаписи уже 11 человек, частично оплачено участие на курсе. Если хотите попасть в группу, стоит задуматься о записи уже сейчас 😉📚
Сайт здесь https://datastudy.ru/

5. Пишу диплом и отчет по практике по Data Governance/Data Marketplace 🤓

6. Делаю проект на фрилансе по разработке дашбордов с данными по недвижимости 🔎

Пару дней назад каким-то магическим образом удалился мой бот, про который писал раньше. Там был доступен ChatGPT, вернее модель davinci. Решил пока не поднимать новый, потому что есть много чего взять на доработку, но пока не в приоритете по времени 😬
Все кто пользовался (~200 человек), не расстраивайтесь, через месяца полтора докручу функционал и выложу новую версию бота 🔝
🔥91👍1