Data Bar | О data-проектах
2.04K subscribers
142 photos
1 file
109 links
Авторский канал о данных, аналитике, визуализации и датапроектах.
Саша Варламов @agvarl, Tableau Zen Master, Avito, ex Playrix, ex InDrive
Download Telegram
Архитектурное наследие Японии

В канале раньше рассказывал про невозможные визуализации в BI. Ещё одна работа с 3D моделями в Tableau рассказывает о классической японской архитектуре. Модели зданий брал из SketchUp. Делал в формате сторителлинга, с описанием и ключевыми событиями для каждого здания на таймлайне. Здания можно поворачивать. Ещё в тексте упоминаются ключевые элементы зданий - их можно подсвечивать на визуализации.

📶 Сама визуализация "Japanese Architectural Heritage"

Большую часть делал в новогодние праздники. Всего около месяца ушло на работу.

Одной из проблем было сделать алгоритм сортировки полигонов в BI по оси Z, чтобы при повороте зданий ближние полигоны перекрывали дальние.

Подробно про такие визы писал в статье "3D модели в Tableau"

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥11
Друзья, с наступающим Новым Годом! 🎄

Последние полтора месяца почти не было времени на канал, и тому были веские причины.
В Новый год я вхожу в новой роли и с крутой командой.
В январе–феврале расскажу кем, куда и что буду делать.

А пока - немного личных итогов уходящего года:

VILKY
Наш общий проект по аналитике IT-зарплат отмечает первый год. Мы собирали данные, делали автоотчёты, подключали LLM — и о нас писали крупные Telegram-каналы.
Последние три месяца проект почти не развиваем, но он живёт самостоятельно. В его данных - целая история динамики IT-рынка, эволюции должностей и многое другое. Скорее всего, поставим проект на паузу и вернёмся к нему, когда появится время.

LLM и MCP
Погружался в мир языковых моделей, подключал их к данным и делился результатами. Тема бездонная - ещё многое предстоит исследовать.

✈️ Аналитика Telegram
Много работал с данными TGStat и Telemetr - мир Telegram оказался невероятно глубоким и сложным, а в сочетании с анализом LLM/NLP можно видеть множество скрытых паттернов в данных.

🍀 Встречи и знакомства
Наконец-то увиделся, пообщался и познакомился вживую с теми, кого давно знал онлайн — это бесценно. Познакомися с ребятами из сообщества "Немного продакт", ещё был классный конкурс авторских TG каналов

А пока ухожу на праздники - хочется провести больше времени с семьёй.
В новом году формат канала хочу немного изменить, как именно - подумаю на праздниках.

С праздником! Желаю вам тёплых дней, уюта и сил для новых свершений. Здоровья вам и вашим близким, счастья и любви.

До встречи в 2026-м! 💫
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾1310👍6👎1
Зарплаты в Европе 2026. Business Intelligence Analyst

К середине 2026 года в Европе прозрачность зарплат станет законодательной нормой. Директива о прозрачности зарплат 2023/970 была принята в мае 2023 го, а у стран-членов EC было 3 года на её имплементацию. Ссылка на директиву 2023/970

В конце каждого года выходит множество отчётов о заработных платах. Отчёты помогают компаниям и сотрудникам ориентироваться в новых реалиях, а, с прозрачностью зарплат, - устанавливать справедливые зарплатные вилки и проводить бенчмаркинг.

Давайте посмотрим на свежий отчёт по европейским зарплатам в 2026 в 25и странах. одного из мировых лидеров аналитики зарплат - компании TalentUp. В публичном PDF больше 80 специальностей, из них - 20+ IT специальностей. Всего анализировали 45 млн зарплат в 8 млн компаниях. Документ прикладываю в комментариях.

Из интересного ещё - процент удалённой работы, занятость по полу, процент повышения ЗП по сравнению с прошлым годом и уровень жизни в сравнении с Нью-Йорком. По сравнению с отчетом 2025 года, добавили разделение на размер компаний, сделали больше специальностей для каждой страны.

Более подробную информация, напр., зарплаты по грейдам, можно получить платно.

На картинках - визуализации усредненных медианных зарплат и диапазоны годовых зарплат с бонусами (от 25го до 75го процентиля). Зарплаты вместе с бонусами, гросс. Брали только столичные зарплаты. Диаграммы я сделал только для Business Intelligence Analyst, как наиболее релевантной должности читателя этого канала. Месячную ЗП считал как среднюю из медианной годовой - так привычнее для нас. Разница между крайними странами в зарплатах (Румыния и Швейцария) - 5 раз.

В визуализациях - ЗП по размеру компаний:
. Корпорации. 10000+ сотрудников
. Стартапы. Инвестиции от $20M до $100M
. Небольшие компании до 250 человек. Инвестиции от $100k до $200k

Зарплаты указаны без вычета налогов (gross), поэтому, сложно понять какую часть получают на руки (net). В странах разные системы налогообложения.

Российских зарплат нет в отчёте PDF, но есть на самом сайте. Базовая годовая ЗП gross у Business Intelligence Analyst - 2 088 100 руб. (22 700k евро), c бонусами - 2 264 400 руб (24 615k евро).

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥125😢1😐1🍾1
Зарплаты аналитиков данных, senior в Европе, 2026

По мотивам прошлого поста и отчёту talentup.io сделал визуализацию годовых зарплат аналитиков данных (Data Analyst, Senior) в 25и странах.

В визуализации - 3 блока по размеру компаний-работодателей:
. Корпорации. 10000+ сотрудников
. Стартапы. Инвестиции от $20M до $100M
. Небольшие компании до 250 человек. Инвестиции от $100k до $200k

На картинке - диапазоны годовых зарплат с бонусами (от 25го до 75го процентиля), гросс.

Российских зарплат нет в отчёте PDF, но есть на сайте. Медианная зарплата с бонусами, gross для аналитика данных (по всем грейдам) за год - 27 600 евро.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🤔2🎉2
Цвета года 2026

Каждый год Pantone объявляет свой Color of the Year. Со стороны это может выглядеть как маркетинговый ритуал, но дизайнеры и аналитики внимательно следят за выбором - они часто сигнализируют о более широких визуальных трендах.

Pantone делает это с 2000 года, а позже к практике подключились и производители красок.

На картинке - визуализация "Paint Colors of the Year" от Julie Peasley. В ней - цвета года от разных производителей красок. Над цветом года работают целые группы дизайнеров и инженеров. Производители красок создают целые коллекции с привязкой к основному цвету. Один цвет мало о чем говорит - лучше его оценивать по сочетанию с другими цветами.

Ниже привожу производителей и названия цветов года 2026 со ссылками на статьи.

Pantone. Cloud Dancer
Azkonobel. Slow Swing, Mellow Flow, Free Groove
Benjamin Moore. Silhouette
Sherwin Williams. Universal Khaki
Glidden. Warm Mahogany
Dunn-Edwards Paints. Midnight Garden
Behr. Hidden Gem
Valspar. Warm Eucalyptus

Если посмотреть на визуализацию, становится очевидно: выбор Pantone может быть и ярким, и нейтральным, и даже парным. Бренды красок выбирают осторожнее: приглушённые цвета для интерьеров, в которых уютно жить.

Статья с визуализацией и датасетом цветов.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍75
Весь прошлый год мы в проекте Vilky собирали и анализировали данные IT вакансий. Вот первый пост по результатам года.
Можете посмотреть как меняется число активных вакансий на платформах поиска работы. Графики уникальные, год ушел на сбор данных
Динамика российского IT-рынка в 2025. Смена ландшафта

В конце 2023 года мы запустили проект анализа зарплат в IT. Сначала данные собирались по одной платформе Getmatch 1 раз в 2 недели, а с февраля стали собирать каждый день и подключать другие платформы. Данные каждый день мы отправляем в дашборд, а статистику по разным специализациям - в TG канал. Всё работает автоматически.

Делаем мы это для того, чтобы понять состояние рынка вакансий IT, используя данные, а не мнения.

2025й год закончился, мы собрали несколько миллионов дата-пойнтов с различных агрегаторов вакансий.

В этом посте показываем динамику активных вакансий на каждый день за год по двум платформам:
1. Getmatch. Премиум-сегмент (300K рублей - медианная зарплата). Платформа для размещения IT вакансий от мидл уровня и выше. В основном, топовые компании РФ и частично компании за рубежом. Все вакансии верифицируются
2. Хабр Карьера. Средний сегмент (200K рублей - медианная зарплата), включая Intern/Junior. Шире охват компаний.

Подавляющее большинство предложений в выборке - от компаний, работающих в России или с возможностью удалёнки.

(Нижний сегмент - IT вакансии локальных компаний и низкой квалификации в исследовании практически не представлен - они есть на HH без разделения на грейды. Медианная зарплата на HH - 90K рублей).

Оба агрегатора указывают грейд вакансии, эта информация используется в анализе. Активные вакансии - те, которые доступны на платформе в конкретный день. То есть, одна вакансия доступна несколько дней.

Итак, на графиках - число и доля активных вакансий по обеим платформам.

Инсайты из данных:
💙 Главный тренд: значительное снижение числа вакансий. На Getmatch к концу ноября 2025 года — минус 45% к ноябрю 2024. По Хабру полного года ещё нет, но падение сильнее
💙 Доля вакасий конкретного грейда в общем числе вакансий. Числа показаны на нижних графиках.
- Синьоры vs Мидлы. Их соотношение примерно 1:1 на обеих платформах. Но доля мидл-вакансий за год снизилась на 5%.
- Лиды. Их стало на 35% меньше, чем вакансий для синьоров или мидлов. Но их доля в общем пуле выросла примерно на 30%. Для лидов общее падение рынка компенсируется возросшим спросом.
- Лидовых вакансий меньше на 35 процентов, чем синьорных или мидловых. Тоже на двух платформах.
- Джуны и интерны. Их крайне мало в количественном выражении (в 6 и 10 раз меньше мидлов или синьоров соответственно). Но их доля не упала, а даже немного подросла - компании полностью не отказываются от этого сегмента.
💙 Сезонность никуда не делась. На графиках четко видны циклы HR-активности: подъем в феврале, спад на майских, осенний набор в сентябре-октябре. Рынок жив, он работает в привычном ритме, просто в меньшем объеме.


Выводы из данных:
💙 Рынок сузился, но не рухнул. Идет концентрация на опытных кадрах, но с сохранением точечного найма на стартовые позиции.
💙 Getmatch (премиум) и Хабр (средний сегмент) показывают очень схожую картину по структуре.

Канал | Дашборд 👈

#аналитика
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥145👍3🍾1
Советские фильмы и диаграммы

В канале Алексея Смагина data.csv недавно вышел пост с ребусами - там зарубежные фильмы были зашифрованы в графиках и диаграммах.

Мне идея понравилась, и я сделал диаграммы по мотивам советского кино.

Попробуйте угадать, какой известный фильм скрывается за каждой диаграммой.

Пишите свои версии в комментариях!

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8🤯6🔥4😱2
Почему команды замедляются, даже когда людей становится больше. И чем сможет помочь AI.

Есть популярная управленческая интуиция: если проект не успевает, нужно добавить людей. Логика простая: сказать "нас не хватает" психологически проще, чем признать архитектурные или организационные проблемы.

Но на практике часто происходит обратное: людей становится больше, а скорость падает. Про это ещё в 1975 году писал руководитель разработки в IBM, Фредерик Брукс. И "Законом Брукса" стали называть идею о том, что новые силы в проекте на поздних стадиях только отодвигают срок его сдачи.

На картинке показаны графы коммуникаций участников проекта. Если совсем просто: чем больше участников системы, тем больше усилий уходит не на работу, а на согласование работы. Сами графы коммуникаций - сильный визуальный инсайт.

Математика тут довольно жесткая. В команде из n человек количество потенциальных коммуникационных связей равно n(n−1)/2.
При росте команды с 5 до 10 человек людей становится вдвое больше, а связей - почти в пять раз.

Это явление называют communication overhead - издержки на коммуникацию.

На уровне ощущений увеличение команды проявляется быстро:
появляется больше встреч
растёт количество чатов
решения принимаются дольше
контекст всё чаще приходится пересказывать

Работа не исчезает, но вокруг неё нарастает шум. Возникает ложное чувсво прогресса: движухи больше, а проект не двигается. Вы сами могли заметить, сколько времени тратится на синки, выравнивания и координацию в больших проектах.

Важно, что Сommunication overhead - это не проблемы общения людей. Это структурная особенность любой сети. В компьютерных сетях ситуация точно такая же: чем больше узлов, тем выше доля служебного трафика. Полезная нагрузка растёт медленнее, чем координация.

Организации устроены аналогично. Процент полезных или бизнес-данных падает с ростом числа коммуникаций, а оверхед на синхронизацию контекста растёт. А это - плюс время и деньги.

Отсюда и эффект, описанный в законе Брукса: добавление людей в запаздывающий проект делает его ещё более запаздывающим. Новым участникам нужен контекст и/или обучение, а старые участники тратят время на его передачу и вкат новых людей. В моменте система становится тяжелее.

Важно понимать, что Communication overhead - не ошибка управления и не признак плохой команды. Это цена за масштаб. Пока команда маленькая, координация бесплатна. После определённого размера она становится основным ограничением.

Именно поэтому многие сильные организации сходятся в числе 5-7 человек на автономную команду. Это точка, где сеть ещё не начинает "говорить сама с собой" больше, чем работать.

А вот теперь, самое интересное. Как можно сократить число узлов и коммуникаций в "человеческой сети"?

В современных реалиях можно применять ИИ, и его уже применяют для этого. Но здесь важно не перепутать роли. Сам ИИ не уменьшает количество связей между людьми, а снижает трение в этих связях: сжимает контекст, делает саммари, помогает вспомнить решения. То есть уменьшает вес коммуникаций, но не отменяет их.

Для снижения оверхеда в команде можно:
1. Уменьшить число узлов сети. Или передать часть рутинной работы ИИ, снизив число участников проекта. При этом кратно упадет число связей.
2. Снизить уровень коммуникации. Это про сжатие контекста с помощью ИИ и использование его возможностей в качестве контекстного буфера.

Примеры по второму пункту:

Самая большая боль в командах не общение, а потеря контекста:
можешь напомнить, почему мы так решили?
где обсуждали?
это актуально или уже поменялось?

ИИ может:
читать чаты
читать таски
читать документы
делать саммари встреч
помнить историю решений

Поэтому, ИИ может выступать как контекстный буфер. А это - минус сотни сообщений и минус десятки встреч. Кроме этого, ИИ может асинхронно взаимодействовать со всеми участниками команды, это - огромная экономия времени на синхронизацию контекста.

Сейчас уже есть агенты, частично покрывающие проблемы оверхеда. Я думаю, в будущем появятся корпоративные решения для полного контроля и синхронизации контекста

#AI

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍8😱1
Про навыкоцентричность.

Headhunter на днях выпустил отчёт "Будущее навыкоцентричности". PDF в комментариях. Если кратко - рынок труда уходит от должностей и дипломов к навыкам. Любой сотрудник - набор навыков. Компания ищет конкретный скиллсет или дообучает недостающим навыкам. Естественно, это сильно влияет на процессы найма, оценки и развития сотрудников.

Интересно, что мы в проекте анализа зарплатных вилок в IT VILKY уже больше года работаем ровно в этом направлении: собираем все возможные навыки из вакансий, используем NPL и LLM для анализа описаний вакансий и нормализации данных.

Про анализ навыков в нашем проекте мы писали много, например, пост. В канале VILKY каждый день появляются самые дорогие и популярные навыки по IT-направлениям - можно буквально видеть "ценник" на Terraform, Python или Data Engineering.

Мы даже пытались считать стоимость любого скиллсета, сколько должен стоить специалист с определённым набором навыков. Собрали словари (до 10k навыков с их синонимами), научились дополнять вакансии скрытыми навыками и получать полный профиль позиции.

В продакшн это не раскатывали - слишком тяжёлый проект получался, да и бизнес в РФ ещё не был готов.

И вот сейчас об этом говорит HH со ссылками McKinsey, Microsoft, Coursera, Udemy и других. Ещё собрали мнения экспертов из разных отраслей. Мнения разные и интересные. Мне понравилось то, что вынес в заглавную картинку.

HH в отчете сообщает, что "Навыкоцентричный подход выбирают 68% российских компаний". Не знаю, откуда взяли 68%, но цифра кажется завышенной. Оцените просто сами что у вас в компании с навыкоцентричностью.

Мировой, а теперь и российский тренд понятен. Так что готовимся к новому слову "Навыкоцентричность". Отчёт HH будет тоже прочитать нелишним любому, кто строит карьеру. У HH еще есть гайд "Как внедрить навыкоцентричный подход в компании".

За стоимостью IT навыков можно следить в нашем канале VILKY или на дашборде - это бесплатно.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥6
От запроса к вопросу. Google представил Conversational Analytics в BigQuery

Вчера Google в блоге показал возможности решения Conversational Analytics в BigQuery. Теперь можно задавать вопросы к данным обычным языком, а система сама строит и выполняет SQL запрос и показывает результат с графиками и пояснениями в веб-интерфейсе. Используются агенты с последними моделями Gemini.

Осенью такое решение было представлена для гуглового Looker. Но Looker - это BI-слой. А здесь - прямое взаимодействие с DWH, без BI посредника.

Это ещё один шаг к демократизации данных.

Гайды Conversational Analytics для BigQuery и Looker.

Что это даёт бизнесу:
Демократизация аналитики. Можно получать ответы без знания SQL и без очереди к аналитикам.
Быстрее инсайты. Бизнес-пользователь напрямую взаимодействует с данными.
Меньше ручного контекста. ИИ читает метаданные и описания таблиц, формируя контекст данных

Давате разберём, почему это не революция:
Ответы ИИ надо проверять. Гугл сам об этом предупреждает.
Для метаданных и описаний таблиц надо проделать колоссальную работу: их нужно описывать, поддерживать и тестировать как агенты работают с метаданными.
Запросы BigQuery стоят денег. В крупных компаниях на запросы уходят десятки тысяч долларов в месяц. Неоптимальные SQL-запросы от ИИ будут сжирать бюджеты. Бизнес-пользователей придётся ограничивать и обучать формулировке вопросов.
Сложные бизнес-инсайты пока это не даст. Нужно много контекста и процессинга данных.

Похоже, что в ближайшем будущем отдельным навыком станет умение формулировать правильные бизнес-вопросы к данным.


💚 А про то, как самому локально развернуть базу данных и подключить к ней Claude через MCP для Conversational Analytics, я писал в посте "AI отчеты на основе данных".
💚 На Хабре сделал полный гайд "Подключаем Claude по MCP к базе данных на домашнем компьютере".

#conversational_analytics #genbi

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5❤‍🔥3
Нефтегаз, дата-центры и социальные сети

Все чаще звучит тема будущего дефицита энергии под вычислительные мощности. Глобальный AI , кроме софта, это физическая инфраструктура: дата-центры, электростанции, сети.

В конце 2000-х я работал на консалтинговых и производственных проектах для крупных нефтегазовых операторов в Казахстане: ENI, British Gas, Chevron и др..

Спустя несколько лет, году в 2014м, один из выпускников, после корпоративного обучения в ENI, рассказал интересную вещь: компания построила под Миланом несколько многоэтажных дата-центров. А он проходил там практику. При встрече он предложил мне догадаться, чем занимаются в дата-центре. Я не угадал - ответ оказался неожиданным.

Помимо геоаналитики, там активно шерстили и анализировали социальные сети. ENI управляет большим числом промышленных объектов по всей планете, а локальные инциденты не всегда сразу доходят до штаб-квартиры. А в соцсетях кто-то может сфоткать фото дыма или аварии буквально в первые минуты и выложить в соцсеть. Это только один пример.

Другими словами, данные из публичного цифрового пространства приходили быстрее внутренних каналов.

Стало интересно, что сейчас у ENI со строительством data-центров.

Сегодня ENI развивает один из крупнейших в Европе вычислительных кластеров в Ломбардии, с собственными суперкомпьютерами и энергоэффективной архитектурой. В 2025 году компания также объявила партнёрство с Khazna (ОАЭ) по созданию AI-кампуса на сотни мегаватт. Питать планируют от новой газовой электростанции.

На официальном сайте есть крутая инфографика про эволюцию суперкомпьютеров с 1948 года и дата-центры. А здесь - много фото дата-центра ENI.

Чем там будут заниматься, можно только предполагать. Но связка LLM + семантический анализ соцсетей + гигантские вычислительные мощности - это уже не просто мониторинг. Это инструмент раннего обнаружения рисков, прогнозирования событий и построения модели мира в реальном времени.

В догонку ноябрьская новость про инвестиции в новое направление для энергетических компаний - AI-инфраструктуру.
Chevron выходит на рынок дата-центров и инвестирует в AI-инфраструктуру в Техасе
Halliburton предлагает специализированные решения для ЦОД
Liberty Energy партнёрится с Oklo (ядерные реакторы) с решениями для энергоёмких клиентов

Что из этого следует
AI требует гигантских объёмов дешёвой и стабильной энергии.
Нефтегазовые компании уже обладают ключевыми компетенциями: генерация, инфраструктура, капиталоёмкие проекты.
Дата-центры становятся новым промышленным активом, сопоставимым по значимости с НПЗ или газовыми хабами.

В этом контексте выигрывать будут те регионы/компании, где есть:
доступная энергия
земля
инженерные кадры
политическая стабильность

Поэтому Казахстан тоже выглядит перспективно. Можно вспомнить инициативу "Долина ЦОД". И на уровне правительства такие инициативы поддерживают. Это оч круто!

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤‍🔥54