Data Bar | О data-проектах
2.04K subscribers
142 photos
1 file
109 links
Авторский канал о данных, аналитике, визуализации и датапроектах.
Саша Варламов @agvarl, Tableau Zen Master, Avito, ex Playrix, ex InDrive
Download Telegram
Знаменитости по росту

Коротко о том, что случается, если оторвать ноль от графика, и как визуал меняет восприятие фактов.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣26😁173🥴3
Аналитика от Аристотеля до Data Science

2000 лет назад аналитикой занимались в античности. Аристотель - отец аналитики, а его трактат "Органон" - базовый труд аналитической теории древности. Кроме прочего, он содержит два трактата: "Первая аналитика" (Analytica Priora) и "Вторая аналитика" (Analytica Posteriora). "Аналитики" стали теоретическим фундаментом для всей европейской науки, философии и математики.

Это труд, где Аристотель создал формальную логику или первый в истории "язык рассуждений" (Придумал античный сторителлинг ).

Цель "Первой аналитики" - понять, как устроено правильное умозаключение.
Цель "Второй аналитики" - понять, как из наблюдений и доказательств получить истинное знание.

Меня хватило только на половину "Первой аналитики", но сложно.

Аристотель считал, что истинное знание начинается с наблюдения, но завершается пониманием причин и общих законов, то есть логическим выводом из первых принципов. C данными в Античности было туго, поэтому приходилось доходить до выводов путём рассуждений.

Отец аналитики ввёл основы формальной логики, которой пользовались более 2000 лет до появления математической логики в XIX веке. Он впервые сформулировал идею научного метода: знание строится на доказательстве, а не на вере или авторитете. Вот за это - отдельное спасибо!

Аристотель подходил к анализу через поиск причин, выделяя 4 типа:

Материальная причина (Из чего это состоит?)
Формальная причина (Как это устроено?)
Действенная причина (Кто или что вызывает это?)
Целевая причина (Зачем это происходит, какая цель?)

Поиск первопричины - не просто факт, а смысл происходящего.

Интересно, что те же причины можно спроецировать на современный анализ данных. На картинке выше показано как рассуждают Аристотель и современный аналитик о причинах падения продаж. ChatGPT помог построить таблицу, но логика понятна.

Аристотель искал "почему" через понимание сути и причин.
Аналитик ищет "почему" через данные и доказательства.
Но оба делают одно и то же по сути - ищут логическую связь между явлением и его причиной.

Это всё к тому, что рассуждения и поиск причин без данных - история, которой уже 2000 лет.

А вы, как аналитики, пробовали читать Аристотеля?

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍63
Скоро заканчиваем прием работ на конкурс Дата Кидс!

Буду в составе жюри датавиз конкурса для детей!
О конкурсе:

Дедлайн подачи работ:
30 октября

Что ждёт участников:
• крутые подарки - iPad, LEGO и ещё много всего классного
• обучающие эфиры, где диаграмму можно построить из игрушек или конфет
• бонусы каждому ребёнку
• детский гайд по диаграммам при регистрации

Скоро уже заканчивается прием работ на этот необычный конкурс детского креатива! Спешите!

Участвовать!
👍84🥰3
Транспортные задачи и оптимальные маршруты.

Поиск оптимальных путей в логистике - мощный инструмент, позволяющий существенно сэкономить время и деньги.

Транспортная задача или задача Монжа-Канторовича - это классическая задача линейного программирования о построении оптимального плана перевозок грузов из пунктов отправления в пункты назначения с минимальными затратами.

Советский учёный Леонид Канторович, один из создателей линейного программирования, зачастую работал по ночам и имел склонность к опозданиям. Поэтому, часто пользовался такси. Обратив внимание на простой факт: машины простаивают, а водители неохотно делают короткие поездки, он вместе с группой учёных с помощью математических методов разработал обоснованные тарифы: ввели плату за посадку и уменьшили цену за километраж. Подобный подход затем применяли таксопарки по всему Советскому Союзу.

Леонид Канторович был удостоен Нобелевской премии за вклад в математическую экономику.


В статье "Транспортные задачи в Python и Tableau" я показал пример поиска оптимальных и неоптимальных маршрутов такси. Геометрия дорог не учитывается - рассматриваются прямые, соединяющие точки посадки с точками высадки. На визуализации можно оценить изменение общей длины маршрутов - почти в 5 раз.

Для иллюстрации задачи были взяты координаты 392 отелей на Манхэттене и 392 местоположений такси (все данные с Kaggle). Представим, что нужно все такси отправить во все 392 отеля для 392 постояльцев в один момент.

Для решения задачи в Python используется библиотека "POT: Python Optimal Transport".

Берутся точки начала маршрутов (Source) и точки концов маршрутов (Target).
Строится матрица расстояний или затрат на перемещение (Cost Matrix)
Вычисляются оптимальные маршруты на матрице Optimal Transport
Визуализируются траектории

Подробности описаны в статье.
Визуализация с анимацией позволяет наблюдать, как траектории переходят от неоптимальных к оптимальным. Это пример того, как математическая задача может привести к реальной экономии.

У компании беспилотного такси Waymo есть патент "Route optimization for autonomous driving systems" - в нём описывается способ оптимизации маршрута для автономного автомобиля. Но там всё сложнее, и оптимальные траектории зависят не только от расстояния, но и от других факторов. Оптимальность здесь - баланс безопасностью, данными, надежностью и временем. А Weymo уже начинает локально замещать Uber в Штатах.

Решение сложных транспортных задач задач в масштабах государств находит применение в таких областях как:
Расчёт местоположения логистических центров
Планирование маршрутов транспорта при проведении крупных мероприятий (например, Олимпийские игры или Чемпионат мира по футболу)
Строительство и развитие дорожной инфраструктуры

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍94
Архитектурное наследие Японии

В канале раньше рассказывал про невозможные визуализации в BI. Ещё одна работа с 3D моделями в Tableau рассказывает о классической японской архитектуре. Модели зданий брал из SketchUp. Делал в формате сторителлинга, с описанием и ключевыми событиями для каждого здания на таймлайне. Здания можно поворачивать. Ещё в тексте упоминаются ключевые элементы зданий - их можно подсвечивать на визуализации.

📶 Сама визуализация "Japanese Architectural Heritage"

Большую часть делал в новогодние праздники. Всего около месяца ушло на работу.

Одной из проблем было сделать алгоритм сортировки полигонов в BI по оси Z, чтобы при повороте зданий ближние полигоны перекрывали дальние.

Подробно про такие визы писал в статье "3D модели в Tableau"

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥11
Друзья, с наступающим Новым Годом! 🎄

Последние полтора месяца почти не было времени на канал, и тому были веские причины.
В Новый год я вхожу в новой роли и с крутой командой.
В январе–феврале расскажу кем, куда и что буду делать.

А пока - немного личных итогов уходящего года:

VILKY
Наш общий проект по аналитике IT-зарплат отмечает первый год. Мы собирали данные, делали автоотчёты, подключали LLM — и о нас писали крупные Telegram-каналы.
Последние три месяца проект почти не развиваем, но он живёт самостоятельно. В его данных - целая история динамики IT-рынка, эволюции должностей и многое другое. Скорее всего, поставим проект на паузу и вернёмся к нему, когда появится время.

LLM и MCP
Погружался в мир языковых моделей, подключал их к данным и делился результатами. Тема бездонная - ещё многое предстоит исследовать.

✈️ Аналитика Telegram
Много работал с данными TGStat и Telemetr - мир Telegram оказался невероятно глубоким и сложным, а в сочетании с анализом LLM/NLP можно видеть множество скрытых паттернов в данных.

🍀 Встречи и знакомства
Наконец-то увиделся, пообщался и познакомился вживую с теми, кого давно знал онлайн — это бесценно. Познакомися с ребятами из сообщества "Немного продакт", ещё был классный конкурс авторских TG каналов

А пока ухожу на праздники - хочется провести больше времени с семьёй.
В новом году формат канала хочу немного изменить, как именно - подумаю на праздниках.

С праздником! Желаю вам тёплых дней, уюта и сил для новых свершений. Здоровья вам и вашим близким, счастья и любви.

До встречи в 2026-м! 💫
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾1310👍6👎1
Зарплаты в Европе 2026. Business Intelligence Analyst

К середине 2026 года в Европе прозрачность зарплат станет законодательной нормой. Директива о прозрачности зарплат 2023/970 была принята в мае 2023 го, а у стран-членов EC было 3 года на её имплементацию. Ссылка на директиву 2023/970

В конце каждого года выходит множество отчётов о заработных платах. Отчёты помогают компаниям и сотрудникам ориентироваться в новых реалиях, а, с прозрачностью зарплат, - устанавливать справедливые зарплатные вилки и проводить бенчмаркинг.

Давайте посмотрим на свежий отчёт по европейским зарплатам в 2026 в 25и странах. одного из мировых лидеров аналитики зарплат - компании TalentUp. В публичном PDF больше 80 специальностей, из них - 20+ IT специальностей. Всего анализировали 45 млн зарплат в 8 млн компаниях. Документ прикладываю в комментариях.

Из интересного ещё - процент удалённой работы, занятость по полу, процент повышения ЗП по сравнению с прошлым годом и уровень жизни в сравнении с Нью-Йорком. По сравнению с отчетом 2025 года, добавили разделение на размер компаний, сделали больше специальностей для каждой страны.

Более подробную информация, напр., зарплаты по грейдам, можно получить платно.

На картинках - визуализации усредненных медианных зарплат и диапазоны годовых зарплат с бонусами (от 25го до 75го процентиля). Зарплаты вместе с бонусами, гросс. Брали только столичные зарплаты. Диаграммы я сделал только для Business Intelligence Analyst, как наиболее релевантной должности читателя этого канала. Месячную ЗП считал как среднюю из медианной годовой - так привычнее для нас. Разница между крайними странами в зарплатах (Румыния и Швейцария) - 5 раз.

В визуализациях - ЗП по размеру компаний:
. Корпорации. 10000+ сотрудников
. Стартапы. Инвестиции от $20M до $100M
. Небольшие компании до 250 человек. Инвестиции от $100k до $200k

Зарплаты указаны без вычета налогов (gross), поэтому, сложно понять какую часть получают на руки (net). В странах разные системы налогообложения.

Российских зарплат нет в отчёте PDF, но есть на самом сайте. Базовая годовая ЗП gross у Business Intelligence Analyst - 2 088 100 руб. (22 700k евро), c бонусами - 2 264 400 руб (24 615k евро).

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥125😢1😐1🍾1
Зарплаты аналитиков данных, senior в Европе, 2026

По мотивам прошлого поста и отчёту talentup.io сделал визуализацию годовых зарплат аналитиков данных (Data Analyst, Senior) в 25и странах.

В визуализации - 3 блока по размеру компаний-работодателей:
. Корпорации. 10000+ сотрудников
. Стартапы. Инвестиции от $20M до $100M
. Небольшие компании до 250 человек. Инвестиции от $100k до $200k

На картинке - диапазоны годовых зарплат с бонусами (от 25го до 75го процентиля), гросс.

Российских зарплат нет в отчёте PDF, но есть на сайте. Медианная зарплата с бонусами, gross для аналитика данных (по всем грейдам) за год - 27 600 евро.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🤔2🎉2
Цвета года 2026

Каждый год Pantone объявляет свой Color of the Year. Со стороны это может выглядеть как маркетинговый ритуал, но дизайнеры и аналитики внимательно следят за выбором - они часто сигнализируют о более широких визуальных трендах.

Pantone делает это с 2000 года, а позже к практике подключились и производители красок.

На картинке - визуализация "Paint Colors of the Year" от Julie Peasley. В ней - цвета года от разных производителей красок. Над цветом года работают целые группы дизайнеров и инженеров. Производители красок создают целые коллекции с привязкой к основному цвету. Один цвет мало о чем говорит - лучше его оценивать по сочетанию с другими цветами.

Ниже привожу производителей и названия цветов года 2026 со ссылками на статьи.

Pantone. Cloud Dancer
Azkonobel. Slow Swing, Mellow Flow, Free Groove
Benjamin Moore. Silhouette
Sherwin Williams. Universal Khaki
Glidden. Warm Mahogany
Dunn-Edwards Paints. Midnight Garden
Behr. Hidden Gem
Valspar. Warm Eucalyptus

Если посмотреть на визуализацию, становится очевидно: выбор Pantone может быть и ярким, и нейтральным, и даже парным. Бренды красок выбирают осторожнее: приглушённые цвета для интерьеров, в которых уютно жить.

Статья с визуализацией и датасетом цветов.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍75
Весь прошлый год мы в проекте Vilky собирали и анализировали данные IT вакансий. Вот первый пост по результатам года.
Можете посмотреть как меняется число активных вакансий на платформах поиска работы. Графики уникальные, год ушел на сбор данных
Динамика российского IT-рынка в 2025. Смена ландшафта

В конце 2023 года мы запустили проект анализа зарплат в IT. Сначала данные собирались по одной платформе Getmatch 1 раз в 2 недели, а с февраля стали собирать каждый день и подключать другие платформы. Данные каждый день мы отправляем в дашборд, а статистику по разным специализациям - в TG канал. Всё работает автоматически.

Делаем мы это для того, чтобы понять состояние рынка вакансий IT, используя данные, а не мнения.

2025й год закончился, мы собрали несколько миллионов дата-пойнтов с различных агрегаторов вакансий.

В этом посте показываем динамику активных вакансий на каждый день за год по двум платформам:
1. Getmatch. Премиум-сегмент (300K рублей - медианная зарплата). Платформа для размещения IT вакансий от мидл уровня и выше. В основном, топовые компании РФ и частично компании за рубежом. Все вакансии верифицируются
2. Хабр Карьера. Средний сегмент (200K рублей - медианная зарплата), включая Intern/Junior. Шире охват компаний.

Подавляющее большинство предложений в выборке - от компаний, работающих в России или с возможностью удалёнки.

(Нижний сегмент - IT вакансии локальных компаний и низкой квалификации в исследовании практически не представлен - они есть на HH без разделения на грейды. Медианная зарплата на HH - 90K рублей).

Оба агрегатора указывают грейд вакансии, эта информация используется в анализе. Активные вакансии - те, которые доступны на платформе в конкретный день. То есть, одна вакансия доступна несколько дней.

Итак, на графиках - число и доля активных вакансий по обеим платформам.

Инсайты из данных:
💙 Главный тренд: значительное снижение числа вакансий. На Getmatch к концу ноября 2025 года — минус 45% к ноябрю 2024. По Хабру полного года ещё нет, но падение сильнее
💙 Доля вакасий конкретного грейда в общем числе вакансий. Числа показаны на нижних графиках.
- Синьоры vs Мидлы. Их соотношение примерно 1:1 на обеих платформах. Но доля мидл-вакансий за год снизилась на 5%.
- Лиды. Их стало на 35% меньше, чем вакансий для синьоров или мидлов. Но их доля в общем пуле выросла примерно на 30%. Для лидов общее падение рынка компенсируется возросшим спросом.
- Лидовых вакансий меньше на 35 процентов, чем синьорных или мидловых. Тоже на двух платформах.
- Джуны и интерны. Их крайне мало в количественном выражении (в 6 и 10 раз меньше мидлов или синьоров соответственно). Но их доля не упала, а даже немного подросла - компании полностью не отказываются от этого сегмента.
💙 Сезонность никуда не делась. На графиках четко видны циклы HR-активности: подъем в феврале, спад на майских, осенний набор в сентябре-октябре. Рынок жив, он работает в привычном ритме, просто в меньшем объеме.


Выводы из данных:
💙 Рынок сузился, но не рухнул. Идет концентрация на опытных кадрах, но с сохранением точечного найма на стартовые позиции.
💙 Getmatch (премиум) и Хабр (средний сегмент) показывают очень схожую картину по структуре.

Канал | Дашборд 👈

#аналитика
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥145👍3🍾1