Любой кризис - это время по-другому смотреть на данные.
Что делает бизнес? Задаёт все новые и новые вопросы и пытается смотреть на "темные данные". Линк с хорошей статьей на тему:
https://www.grow.com/blog/whos-afraid-of-the-dark-data
Что делаю я как архитектор? Ищу новые фичи и инструменты. Нашла process mining для Tableau , - по ощущениям, специальное ПО для process mining может больше, но эта штука тоже интересная.
https://appsfortableau.com/extensions-for-tableau/process-mining-in-tableau/
Что делает бизнес? Задаёт все новые и новые вопросы и пытается смотреть на "темные данные". Линк с хорошей статьей на тему:
https://www.grow.com/blog/whos-afraid-of-the-dark-data
Что делаю я как архитектор? Ищу новые фичи и инструменты. Нашла process mining для Tableau , - по ощущениям, специальное ПО для process mining может больше, но эта штука тоже интересная.
https://appsfortableau.com/extensions-for-tableau/process-mining-in-tableau/
Grow
Who’s Afraid of the Dark Data? | Grow.com
While not completely new—dark data has been around since the dawn of the big data era—understanding and properly dealing with dark data could be a major part of any potential disruptor’s strategy.
Котятки🐱
Когда я была юна, неопытна и не знала о существовании Power BI и Power Query, была у меня боль - сводить ручную отчетность. А у тех, кто присылал мне эту отчетность, любимыми развлечениями были: изменить шапку, добавить лишние строки, переименовать столбец.
Ну что ж, добро пожаловать в магию Power Query, где такие препятствия вполне преодолимы:
https://powerpivotpro.com/2018/02/power-query-magic-dynamically-remove-leading-rows-columns/
Когда я была юна, неопытна и не знала о существовании Power BI и Power Query, была у меня боль - сводить ручную отчетность. А у тех, кто присылал мне эту отчетность, любимыми развлечениями были: изменить шапку, добавить лишние строки, переименовать столбец.
Ну что ж, добро пожаловать в магию Power Query, где такие препятствия вполне преодолимы:
https://powerpivotpro.com/2018/02/power-query-magic-dynamically-remove-leading-rows-columns/
P3 Adaptive
Power Query (M)agic: Dynamically remove leading rows AND columns - P3 Adaptive
The scenario – source data sheets that are structured differently! Does Power Query sometimes seem too rigid? It’s great for defining a sequence of
Котятки🐱
Мои коллеги написали статью на хабре, и я просто не могу её не запостить) Статья посвящена хранилищу данных в целом и тому, какой подход реализовали при разработке архитектуры и логики. Ну и частично это - изнанка той деятельности, которая лежит "под капотом"наших любимых дашбордов)
https://m.habr.com/ru/company/sibur_official/blog/496996/
Мои коллеги написали статью на хабре, и я просто не могу её не запостить) Статья посвящена хранилищу данных в целом и тому, какой подход реализовали при разработке архитектуры и логики. Ну и частично это - изнанка той деятельности, которая лежит "под капотом"наших любимых дашбордов)
https://m.habr.com/ru/company/sibur_official/blog/496996/
Хабр
Особенности data-driven в нефтехимии
При создании любого бизнеса каждое из его подразделений автоматизирует само себя. Как правило сквозные потоки данных между ними единичны. Это приводит к тому, что данные нельзя сопоставить друг с...
Ах мои котятки🐱,
Тяжело жить с self-service BI: на каждом шагу спотыкаются пользователи на пути построения и тиражирования регулярной отчётности. Ещё больше спотыкаются они об ad hoc отчетность, как в вопросах чтения и понимания данных, так и в вопросах подходов и создания среды.
Ниже цикл коротеньких статей на тему "Почему не работает ad-hoc отчетность". Автор работает в мире SAP BusinessObjects, но интересен сам разбор проблем (особенно с точки зрения безопасности данных), советы по созданию среды и концепция построения self-service BI как итеративного процесса.
Часть 1
Часть 2
Часть 3
Часть 4
Часть 5
Тяжело жить с self-service BI: на каждом шагу спотыкаются пользователи на пути построения и тиражирования регулярной отчётности. Ещё больше спотыкаются они об ad hoc отчетность, как в вопросах чтения и понимания данных, так и в вопросах подходов и создания среды.
Ниже цикл коротеньких статей на тему "Почему не работает ad-hoc отчетность". Автор работает в мире SAP BusinessObjects, но интересен сам разбор проблем (особенно с точки зрения безопасности данных), советы по созданию среды и концепция построения self-service BI как итеративного процесса.
Часть 1
Часть 2
Часть 3
Часть 4
Часть 5
Когда-то давно концепция дизайн-мышления произвела революцию в моей голове. Теперь от неё отпочковался концепт Design Sprint🙈
Ниже статья про архитектурное решение BI (вся цепочка: источники- etl -dwh- дашборды), ничего нового, но упаковано всё в организационный подход Design Sprint, что, судя по всему, даёт неплохие скорости на старте крупных BI - проектов:
Линк: https://sprintstories.com/solution-architecture-design-sprint-998c425ff831
Ниже статья про архитектурное решение BI (вся цепочка: источники- etl -dwh- дашборды), ничего нового, но упаковано всё в организационный подход Design Sprint, что, судя по всему, даёт неплохие скорости на старте крупных BI - проектов:
Линк: https://sprintstories.com/solution-architecture-design-sprint-998c425ff831
Medium
Enterprise BI Solution Design Sprint
How to transform Business Performance Goals into an Analytics Digital Solution in eight weeks
Котятки🐱,
Хорошей пятнички и ловите книгу на вечер👆. Тема операционной аналитики и дашборды как её инструменты, - возможно, наше ближайшее будущее)
Хорошей пятнички и ловите книгу на вечер👆. Тема операционной аналитики и дашборды как её инструменты, - возможно, наше ближайшее будущее)
Forwarded from data.csv (Alexey Smagin)
У ТАСС, Московского центра урбанистики и Habidatum большой проект про то, где москвичам проще пережить самоизоляцию.
Вот тут — сердце работы — интерактивная карта, на которой можно сравнивать районы по разным показателям — по площади дворовых территорий, количеству человек на лифт, количеству фасадов, выходящих на юг и юго-восток и многим другим.
А на сайте ТАСС будет выходить цикл материалов, где детально будут рассматриваться каждые показатели и статистика по ним.
Вот, например, текст, про то, почему так важно видеть солнышко в окошко, и где больше вероятность пересечься с соседями:
https://tass.ru/obschestvo/8271875
Вот тут — сердце работы — интерактивная карта, на которой можно сравнивать районы по разным показателям — по площади дворовых территорий, количеству человек на лифт, количеству фасадов, выходящих на юг и юго-восток и многим другим.
А на сайте ТАСС будет выходить цикл материалов, где детально будут рассматриваться каждые показатели и статистика по ним.
Вот, например, текст, про то, почему так важно видеть солнышко в окошко, и где больше вероятность пересечься с соседями:
https://tass.ru/obschestvo/8271875
Одна из проблем, с которыми сталкиваешься в дашборде - перекрестная фильтрация, когда определенный график должен фильтроваться или по одной, или по другой диаграмме, но не одновременно по двум.
Как пролечивать такую проблему в Tableau:
https://lesviz.com/blog/2016/07/03/how-to-prevent-cross-filtering-tableau/
Подробный материал про фильтры в Tableau:
https://www.guru99.com/filter-data-tableau.html
Как пролечивать такую проблему в Tableau:
https://lesviz.com/blog/2016/07/03/how-to-prevent-cross-filtering-tableau/
Подробный материал про фильтры в Tableau:
https://www.guru99.com/filter-data-tableau.html
Guru99
Types of Filters in Tableau: Condition by Formula, Extract, Context
Data can be organized and simplified by using various techniques in Tableau. We will use the "Sample– Superstore.csv" text file for demonstration in this tutorial. In this tutorial you will learn Type
Вчера я вплотную подобралась к LOD - выражениям Tableau, -встроенному синтаксису Tableau , позволяющему управлять уровнями детализации.
Очень полезная штука тестирования и анализа данных, так как дает возможность быстро "покрутить" разные разрезы, не перестраивая данные и не создавая дополнительные вычисляемые столбцы.
Подробная статья с примерами:
https://vizualintelligenceconsulting.com/blog-tableau-lod-expressions/
Что такое LOD в целом:
https://www.tableau.com/learn/whitepapers/understanding-lod-expressions
Очень полезная штука тестирования и анализа данных, так как дает возможность быстро "покрутить" разные разрезы, не перестраивая данные и не создавая дополнительные вычисляемые столбцы.
Подробная статья с примерами:
https://vizualintelligenceconsulting.com/blog-tableau-lod-expressions/
Что такое LOD в целом:
https://www.tableau.com/learn/whitepapers/understanding-lod-expressions
Vizual Intelligence Consulting
Tableau LOD Expressions
Котятки🐱
Как лодку назовешь - так она и по плывёт) Аналогично, какую метрику выберешь, так данные и будут вводить тебя в заблуждение😜 Выше идеальный пример того, как заставить всех волноваться.
Число убийств на 100 000 человек в Ватикане в 1998 году - 256.
Население Ватикана в 1998 году -781 человек.
Уровень убийств х население = общее количество убийств
(256/100000) х 781 = 2
График показывает, что в большинстве лет в Ватикане не было никаких убийств, но в 1998 году их было 2.
Ссылка на оригинальный пост на реддите:
https://www.reddit.com/r/dataisbeautiful/comments/g77wwj/oc_the_homicide_rate_in_vatican_city/?utm_medium=android_app&utm_source=share
Как лодку назовешь - так она и по плывёт) Аналогично, какую метрику выберешь, так данные и будут вводить тебя в заблуждение😜 Выше идеальный пример того, как заставить всех волноваться.
Число убийств на 100 000 человек в Ватикане в 1998 году - 256.
Население Ватикана в 1998 году -781 человек.
Уровень убийств х население = общее количество убийств
(256/100000) х 781 = 2
График показывает, что в большинстве лет в Ватикане не было никаких убийств, но в 1998 году их было 2.
Ссылка на оригинальный пост на реддите:
https://www.reddit.com/r/dataisbeautiful/comments/g77wwj/oc_the_homicide_rate_in_vatican_city/?utm_medium=android_app&utm_source=share
На прошлой неделе мы героически бились с объединением двух Custom sql в Tableau. Выводы такие:
1. Всегда нужно помнить, что join - это не то, чем кажется, и способен, в случае связи "многие ко многим" , мультиплицировать данные в несколько раз (у меня - в 30).
Подробнее про суть join читать тут:
https://m.habr.com/ru/post/448072/
2. Для того, чтобы слепить несколько кусков данных в один большой кусок, можно использовать функцию Union.
Про функцию читать тут.
Материал- разбор про aggregate, join и union в Tableau читать тут.
3. Функция Union в Tableau работает, если в качестве источников выбраны файлы или таблицы/витрины данных, но не работает на 2х CustomSQL: между ними сделать Union нельзя.
Справились мы, короче, и вы справитесь.
Берегите себя🐱
1. Всегда нужно помнить, что join - это не то, чем кажется, и способен, в случае связи "многие ко многим" , мультиплицировать данные в несколько раз (у меня - в 30).
Подробнее про суть join читать тут:
https://m.habr.com/ru/post/448072/
2. Для того, чтобы слепить несколько кусков данных в один большой кусок, можно использовать функцию Union.
Про функцию читать тут.
Материал- разбор про aggregate, join и union в Tableau читать тут.
3. Функция Union в Tableau работает, если в качестве источников выбраны файлы или таблицы/витрины данных, но не работает на 2х CustomSQL: между ними сделать Union нельзя.
Справились мы, короче, и вы справитесь.
Берегите себя🐱
Хабр
Понимание джойнов сломано. Это точно не пересечение кругов, честно
Так получилось, что я провожу довольно много собеседований на должность веб-программиста. Один из обязательных вопросов, который я задаю — это чем отличается INNER JOIN от LEFT JOIN. Чаще всего...
Котятки🐱
Со мной поделились хорошей ссылкой на визуальный словарь для Power BI, - интерактивку, которая помогает подобрать оптимальную символику для визуализации данных.
А я делюсь с вами:
https://sqljason.com/2018/12/financial-times-visual-vocabulary-power-bi-edition.html
Аналог для Tableau (уже вроде было, но продублирую):
https://www.theinformationlab.co.uk/2018/08/31/visual-vocabulary/
Со мной поделились хорошей ссылкой на визуальный словарь для Power BI, - интерактивку, которая помогает подобрать оптимальную символику для визуализации данных.
А я делюсь с вами:
https://sqljason.com/2018/12/financial-times-visual-vocabulary-power-bi-edition.html
Аналог для Tableau (уже вроде было, но продублирую):
https://www.theinformationlab.co.uk/2018/08/31/visual-vocabulary/
Иногда мне кажется, что Tableau можно осваивать бесконечно.
Но кто сказал, что нельзя выучить какие-то базовые вещи за 3 дня?
Котятки, ловите мануальчик:
https://www.guru99.com/tableau-tutorial.html
Но кто сказал, что нельзя выучить какие-то базовые вещи за 3 дня?
Котятки, ловите мануальчик:
https://www.guru99.com/tableau-tutorial.html
Guru99
Tableau Tutorial for Beginners: Learn Basics in 3 Days
Tableau Software is a software company headquartered in Seattle, Washington, United States which produces interactive data visualization products focused on business intelligence. It initially began
Котятки,
Несмотря на не идеальную работу, мне очень нравится модуль " Вопросы и ответы" в Power BI, в первую очередь, за идею - "возможность задать вопрос данным".
Сейчас это скорее игрушки, а вскоре, возможно, будущее)
Линк, чтобы начать работу:
https://docs.microsoft.com/ru-ru/power-bi/natural-language/q-and-a-intro
Несмотря на не идеальную работу, мне очень нравится модуль " Вопросы и ответы" в Power BI, в первую очередь, за идею - "возможность задать вопрос данным".
Сейчас это скорее игрушки, а вскоре, возможно, будущее)
Линк, чтобы начать работу:
https://docs.microsoft.com/ru-ru/power-bi/natural-language/q-and-a-intro
Docs
Узнайте, как использовать естественный язык для изучения данных с помощью Power BI Q&A - Power BI
Обзор использования Power BI Q&A для изучения данных и создания визуализаций с помощью Power BI Q&A с запросами естественного языка.
Дашбордец
Котятки, Несмотря на не идеальную работу, мне очень нравится модуль " Вопросы и ответы" в Power BI, в первую очередь, за идею - "возможность задать вопрос данным". Сейчас это скорее игрушки, а вскоре, возможно, будущее) Линк, чтобы начать работу: https:/…
А чтобы научить модуль "Вопросы и ответы" русскому языку, можно станцевать с бубном или с мерами😱
Подробности тут:
https://kkadikin.ru/ru/blog/article_012/
P. S. Спасибо за ссылку коллегам из чатика Power BI) https://t.iss.one/PBI_Rus
Подробности тут:
https://kkadikin.ru/ru/blog/article_012/
P. S. Спасибо за ссылку коллегам из чатика Power BI) https://t.iss.one/PBI_Rus
kkadikin.ru
Smile advisory
Обучение режима "Q&A" русскому языку
Котятки,
Сейчас, подходя к дашборду как бизнес-аналитик, я все больше понимаю:
- на этапе бизнес-анализа надо собирать все данные о проблеме, а не только те, которые предоставлены изначально заказчиком;
-выводить на дашборд надо те данные, которые имеют отношение к принятию решения;
-работая с глубиной контекста, необходим баланс между "выбраковкой" лишнего и углублением данных ради самого углубления.
Где этот баланс-не ясно, а линк на плакат "Ошибки в данных" и их детальный разбор ловите:
https://www.geckoboard.com/best-practice/statistical-fallacies/
Сейчас, подходя к дашборду как бизнес-аналитик, я все больше понимаю:
- на этапе бизнес-анализа надо собирать все данные о проблеме, а не только те, которые предоставлены изначально заказчиком;
-выводить на дашборд надо те данные, которые имеют отношение к принятию решения;
-работая с глубиной контекста, необходим баланс между "выбраковкой" лишнего и углублением данных ради самого углубления.
Где этот баланс-не ясно, а линк на плакат "Ошибки в данных" и их детальный разбор ловите:
https://www.geckoboard.com/best-practice/statistical-fallacies/
Geckoboard
Statistical fallacies and how to avoid them | Geckoboard
Discover common tricks that data can play on you, so you can avoid mistakes in data analysis. Our guide includes real-life examples and a printable poster. Get your guide
Профессия бизнес-аналитика переживает вторую волну популярности. Несмотря на то, что я в их числе, мне кажется, что в ближайшем будущем эта профессия или умрет, или трансформируется. Концепция Augmented Analytics пережила бум а 2017-2018 годах, и не нашла воплощения: разработка реально работающего продукта стоит дорого, а выхлоп пока не ясен. Но думаю, у нас всё впереди🙈
Крутая статья на Medium :
https://medium.com/analytics-for-humans/augmented-analytics-demystified-326e227ef68f
Обзорная статья Gartner тут:
https://blogs.gartner.com/rita-sallam/2017/07/31/just-buying-into-modern-bi-and-analytics-get-ready-for-augmented-analytics-the-next-wave-of-market-disruption/
Как изменится жизнь - тут:
https://lingarogroup.com/augmented-analytics/
Крутая статья на Medium :
https://medium.com/analytics-for-humans/augmented-analytics-demystified-326e227ef68f
Обзорная статья Gartner тут:
https://blogs.gartner.com/rita-sallam/2017/07/31/just-buying-into-modern-bi-and-analytics-get-ready-for-augmented-analytics-the-next-wave-of-market-disruption/
Как изменится жизнь - тут:
https://lingarogroup.com/augmented-analytics/
Котятки,
"Под капотом" дашборда лежат процессы управления данными, -то, что обеспечивает непрерывность поставки данных в дашборд, их надежность и полноту .
Концепция DataOps включает в себя инструменты и процессы, которые способствуют более быстрой и надежной аналитике данных.
Подробная статья на тему:
https://www.dataversity.net/understanding-dataops/
"Под капотом" дашборда лежат процессы управления данными, -то, что обеспечивает непрерывность поставки данных в дашборд, их надежность и полноту .
Концепция DataOps включает в себя инструменты и процессы, которые способствуют более быстрой и надежной аналитике данных.
Подробная статья на тему:
https://www.dataversity.net/understanding-dataops/
DATAVERSITY
Understanding DataOps - DATAVERSITY
DataOps (data operations) has its roots in the Agile philosophy. It relies heavily on automation, and focuses on improving the speed and accuracy of computer processing, including analytics, data access, integration, and quality control.
В последнее время я все чаще наталкиваюсь на вопросы, связанные с предиктивной и прогнозной аналитикой. Новый концепт - Continuous Foresight- говорит нам о том, что от дискретной предиктивной аналитики мы должны перейти к непрерывной.
Свеженькая статья в блогах Gartner тут:
https://blogs.gartner.com/marty-resnick/continuous-foresight-important-ever/
Увы и ах, возможности BI-ПО в вакууме явно рассчитаны на описательную и диагностическую аналитику, и работа с объемами данных для предиктивной аналитики возможна только с использованием хранилищ с раскатанными и материализованными витринами.
Свеженькая статья в блогах Gartner тут:
https://blogs.gartner.com/marty-resnick/continuous-foresight-important-ever/
Увы и ах, возможности BI-ПО в вакууме явно рассчитаны на описательную и диагностическую аналитику, и работа с объемами данных для предиктивной аналитики возможна только с использованием хранилищ с раскатанными и материализованными витринами.
Gartner
Three Factors Weighing on Growth Rates in 2023
Investing in differentiators that drive long-term success, despite pressures that weigh on growth prospects, is critical. #BusinessGrowth #Research #DigitalTransformation