Чартомойка
14.9K subscribers
733 photos
26 videos
4 files
621 links
О графиках: плохих, хороших и других. От восхищения до ненависти — один chart.
Заметили подозрительный график, присылайте — @bogachev11
Download Telegram
Карта распространенности коронавирусной инфекции в России на сайте стопкоронавирус.рф.

В целом, уровень визуальной коммуникации с данными на сайте неплох. Но эта карта откровенно неудачна. Мы видим, что кружочки разные по размеру, значит их размер показывает какие-то значения.
Какие именно — мы не знаем, это первый минус этой карты. У нее отсутствует легенда.
Вторая большая проблема — это размер самих пузырьков. Непонятно, к чему он привязан и какую полезную информацию мы из него можем получить. По этому поводу также нужна легенда, её нет. И что бы эти кружочки не показывали (выявленных, активных, умерших), очевидно, что визуально оценить разницу между регионами невозможно. В некоторых регионах выявлено 20-25 заболевших, в некоторых счёт идет на тысячи, в Москве — на десятки тысяч. То есть разница на порядок и даже порядки, то есть сотни и тысячи раз. В таких же соотношениях должен меняться и размер кружочков, чего не наблюдается.
Завтра поговорим о коронавирусных визуализациях. Онлайн, конечно. Начало в 15:30 МСК.

Вход свободный, регистрация тут: https://bit.ly/virus_data_4
Слушай, Алиса.
А что у тебя с графиками на мобилках?

https://m.market.yandex.ru/product--perchatki-paclan-nitrilovye/431289653?local-offers-first=0
Записал мини-фильм «Что скрывает российская статистика по коронавирусу».

Полная версия тут: https://youtu.be/La03WTyBfP4
Короткая версия (самые интересные моменты) тут: https://youtu.be/uG-5kHTOJMM

Основные выводы для тех, кто не хочет смотреть видео, ниже. Осторожно, там всё состоит из спойлеров.

1. В Москве эпидемия есть, но несопоставимо меньше, например, чем в Нью-Йорке или странах Западной Европы. Эпидемии есть еще примено в 6-7 регионах РФ. В части из них высокие значения выявленных объясняются очагами заражения на стройках, месторождениях, производственных объектах и общежитиях. В остальных регионах число выявленных больных относительно малое, и растёт медленно.
Это подтверждается (не противоречит) всем имеющимся данным. Если бы заболевших было действительно значительно больше, это вызвало бы перегруз системы здравоохранения, который невозможно было бы скрыть и гораздо более значительное повышение смертности.

1а. Это провал и катастрофа? Нет, наоборот. Были метания и ошибки, но главное — введение карантина — было сделано вовремя и верно.

2. Оценки по выявленным случаям выглядят относительно реалистичными и соответствуют другим похожим странам. Хотя некоторые кривые, особенно по летальности варьируются слишком в узком диапазоне и почти не имеют пиков.
Причины, по которым эпидемия развивается так медленно до конца не ясны. Но это соответствует ситуации по всей Восточной Европе.
— своевременно введённый карантин
— меньше транспортных пересечений
— особенности менталитета.

2а. В последние 1,5 недели темпы развития эпидемии в России однако ускорились. Недавний подъем количества является скорее всего своего рода второй волной, связанной вероятно с менее строгим соблюдением людьми режима самоизоляции.

Продолжение выводов и рекомендации по ссылке.
Тут ребята не согласны с моей оценкой карты со стопкоронавирус.рф и считают, что задача решена прекрасно:

ИМХО, оценивать удачность/неудачность важно исходя из цели, контекста ситуации в которой используется данный чарт. А ситуация на мой взгляд такова, что данный чарт должен создать ощущение, что "шеф, всё пропало", и эту задачу данный чарт решает великолепно. Талантливо выбранная визуализация, где Россия похожа на больного человека, покрытого пятнами кори.
https://t.iss.one/antxt/247

Только вот проблема в том, что выполнение одной задачи не должно вводить читателей в заблуждение относительно других важных вещей, это раз. А сейчас это по сути вообще не визуализация количественных данных, а скорее качественных, где кружок показывает наличие выявленных в регионе. Но тогда от разного размера нужно отказаться вовсе, потому что мы привыкли считывать количество через площадь объектов. Лучше уж тогда одного размера сделать кружки, или просто закрасить регионы, где есть выявленные. А если они есть везде, то это вовсе теряет всякий смысл.

В России далеко не всё пропало, а всё довольно благополучно по коронавирусу в 90% регионов. Это два. То есть визуализация опять-таки вводит в заблуждение.

Ну, и если уж говорить более широко, хотелось бы помимо карты общего количества выявленных, карту за условно последнюю неделю, и лучше в пересчете на число жителей, чтобы понимать, где сейчас реально нужно усиливать эпидемиологические меры.
Немного посложнее попробуем
Милые комиксы на тему визуализации данных и статистики

https://www.boredpanda.com/statistically-insignificant-comics-raf-schoenmaekers/
Алексей Колоколов — кладезь знаний и интересных историй по визуализации корпоративной аналитики. Оказывается он ведёт канал @analyst_club, где делится полезными ссылками, размышлениями и теми самыми интересными историями.

Вот, например, пост о тяжёлых буднях создателей дэшбордов для бизнеса: https://alexkolokolov.com/digital_transform
Я не раз писал в канале о том, как хорошие и даже крутые дизайнеры делают слабую и безграмотную инфографику. Однажды в таком разборе уже засветилась студия Лебедева со своей презентацией для Бауманки.

К сожалению, в отношении представления данных в студии ничего не поменялось. Разберем свежую презентацию для швейцарской криптовалютной комании

Продолжение по ссылке.

#разборыграфиков
Больше Александра Богачева! Поучаствовал в двух видеоподкастах в качестве интервьюируемого. Говорил вроде об одном и том же, но получилось два совершенно разных разговора.
С Ромой Буниным больше показывал и рассказывал о проектах, причем многие до этого вообще никому не демонстрировал и никуда не выкладывал.
С Алексей Малаховским мы обошлись совсем без картинок в разговоре об инфографике, что было для меня в новинку. Получилось больше деталей о жизни и размышлений.

Ссылка на интервью с Ромой (1 час 35 минут): https://www.youtube.com/watch?v=4G3ZvYc0XmY

Таймкоды:
6:02 — Медицинская инфографика — про визуализацию в медицине и почему нет графиков для анализов
23:57 — РИА Новости — про метрики медийных проектов, выбор тем для проектов и упрощение визуализаций для медиа
1:00:51 — Спецпроекты — про подходы к работе с проектом
1:15:05 — Чем занимается сейчас — чем вдохновляется и за чем следит
1:22:31 — Блиц

Ссылки на проекты, которые обсуждаем: https://revealthedata.com/examples/digest/all/primery-rabot-aleksandra-bogacheva/

Ссылка на интервью с Лешей (59 минут):
https://www.youtube.com/watch?v=lJCkQX4UW8Y

Интересные моменты без таймкодов:
— Цифровизация работы участкового врача своими силами
— Как лень и прокрастинация помешали развивать свою студию дизайна и инфографики в Петербурге
— Лучшие российские СМИ по инфографике
— Кто идет учиться дата-журналистике сейчас
— Совет журналистам. Делать инфографику самому или обратиться на аутсорс
Прекрасный, почти эталонный проект по визуализации картографических данных.

Карта возраста домов Петербурга, с крайне увлекательным описанием процесса создания, возможностью купить постер с этой же картой и ссылкой на бесплатный датасет и предложением свободно использовать его в своих проектах.

https://how-old-is-this.house
📈 и 📉

Есть два таких имоджи: растущий график и падающий график.

Я удивлялся, почему они в таких цветах. Почему рост показывается красным, а падение синим? Мы традиционно хорошее показываем зелёным, а плохое — красным. Рост — это обычно хорошо, а падение — это обычно плохо.

Ответ оказался в том, что в Японии красным показывают хорошее, а синим — плохое. Тут ещё есть немного дополнительной путаницы из-за того, что синий в Японии считает оттенком зелёного.

Теперь я удивляюсь тому, что у этих эмоджи до сих пор нет альтернативных вариантов. Есть, например, четыре типа гор: 🌋 🏔 🗻 и три типа компакт-дисков: 💽 💿 📀. А важных вариантов для графиков, которые не вводили бы в заблуждение европейцев нет
Открылось прекрасное, если скопировать этот текст в вотсап, то эмодзи начинают выглядеть по-другому ;)
График от Блумберга, где одни и те же данные показаны сразу в трех формах. Это число увольнений в компаниях Кремниевой долины во время карантина.

Черные столбики — увольнение по дням.
Бледно-фиолетовые — за неделю.
Ярко-пурпурные — кумулятивный рост количества увольнений.

Каждый из этих вариантов даёт свой взгляд на тему. Можно отметить ещё линии времени с отсечками по неделям, откуда наглядно видно, что увольняют обычно в середине недели.

Прекрасно то, что у всех графиков общая ось Y.

#датавизприемы

https://www.bloomberg.com/graphics/2020-coronavirus-technology-layoffs/
Forwarded from Reveal the Data
Пилотирую новую рубрику «Лайфхаки в Табло» — короткие видео с необычными приёмами или мелочами, которые можно пропустить при работе с Табло. Написал в блоге почему решил её запустить.

0:00 — Сортировка по значению за последний месяц с помощью nested table calcs
4:04 — Оформление спарклайнов при помощи reference lines
7:12 — Highlighted таблица с подсветкой по одной метрике из measure values
Немножко мероприятий.
Продолжается шикарная конференция по дата-журналистке LAMPA. Онлайн, конечно. Программа — огонь. Подробности и регистрация по ссылке: https://lampa2020.tilda.ws/

А сегодня, уже через 1,5 часа (в 14:00 по МСК) Вадимом Макаренко обсудим как делать журналистские проекты, основанные на данных.

Встреча будет полезной, даже если вы не имеете представления с чего начинать. Поговорим о том, как собрать команду или найти и воспитать людей у себя в коллективе, как организовать процесс, как не "закопаться" в данных, а выдавать регулярный результат.

Тема: "Данные в редакциях. Как их искать и как с ними работать".

Участие бесплатное для подписчиков группы АНРИ-Медиа на Facebook и членов АНРИ.

Регистрация здесь: https://www.anri-media.ru/events/webinars/8-iyunya-diskussiya-po-bolshim-dannym-/

А если кто-нибудь захочет задонатить, это можно будет сделать через таймпад, привязанный к мероприятию или обратиться к [email protected]