Чартомойка
14.9K subscribers
733 photos
26 videos
4 files
621 links
О графиках: плохих, хороших и других. От восхищения до ненависти — один chart.
Заметили подозрительный график, присылайте — @bogachev11
Download Telegram
Как справедливо замечают, разрыв между ожидаемым и коронавирусом может быть вызван не только недоучетом смертей от самого коронавируса, но также и смертями по другим причинам – вследствие того, что не было койкомест или врачей, чтобы лечить людей
Если на клетке слона прочтёшь надпись «буйвол», не верь глазам своим. К вопросу о заголовках, подчеркивающих главную идею визуализации.
Не все поняли, что я имел в виду в последнем посте. В заге написано "Как растёт уровень самоизоляции", а на картинке отчетливо видно, как он снижается. Возможно, заголовок сделали в то время, когда он действительно рос, с 28 марта по 5 апреля, но после этого его не обновляли, и сейчас график и заг противоречат друг другу
Гениальная история о статистике. Прям готовый фрагмент для книги )
Мы едва ли можем понять из визуализации, в какой части России больше всего проблем с пандемией.

И это не говоря о том, что на карте нужны и другие режимы. Привязка к количеству населения, количество проведенных тестов, процент заболевших к количеству тестов и т.п.
Такая карта будет давать больше информации и вызывать гораздо больше доверия, повышая качество визуальной коммуникации.

Здорово, что есть сводная таблица по всем регионам и при клике на соответствующий регион можно посмотреть данные в динамике, но карта — это лицо всего проекта, именно на неё человек будет смотреть в первую очередь. Сейчас она возможные задачи, которые она может решать, не решает.
Карта распространенности коронавирусной инфекции в России на сайте стопкоронавирус.рф.

В целом, уровень визуальной коммуникации с данными на сайте неплох. Но эта карта откровенно неудачна. Мы видим, что кружочки разные по размеру, значит их размер показывает какие-то значения.
Какие именно — мы не знаем, это первый минус этой карты. У нее отсутствует легенда.
Вторая большая проблема — это размер самих пузырьков. Непонятно, к чему он привязан и какую полезную информацию мы из него можем получить. По этому поводу также нужна легенда, её нет. И что бы эти кружочки не показывали (выявленных, активных, умерших), очевидно, что визуально оценить разницу между регионами невозможно. В некоторых регионах выявлено 20-25 заболевших, в некоторых счёт идет на тысячи, в Москве — на десятки тысяч. То есть разница на порядок и даже порядки, то есть сотни и тысячи раз. В таких же соотношениях должен меняться и размер кружочков, чего не наблюдается.
Завтра поговорим о коронавирусных визуализациях. Онлайн, конечно. Начало в 15:30 МСК.

Вход свободный, регистрация тут: https://bit.ly/virus_data_4
Слушай, Алиса.
А что у тебя с графиками на мобилках?

https://m.market.yandex.ru/product--perchatki-paclan-nitrilovye/431289653?local-offers-first=0
Записал мини-фильм «Что скрывает российская статистика по коронавирусу».

Полная версия тут: https://youtu.be/La03WTyBfP4
Короткая версия (самые интересные моменты) тут: https://youtu.be/uG-5kHTOJMM

Основные выводы для тех, кто не хочет смотреть видео, ниже. Осторожно, там всё состоит из спойлеров.

1. В Москве эпидемия есть, но несопоставимо меньше, например, чем в Нью-Йорке или странах Западной Европы. Эпидемии есть еще примено в 6-7 регионах РФ. В части из них высокие значения выявленных объясняются очагами заражения на стройках, месторождениях, производственных объектах и общежитиях. В остальных регионах число выявленных больных относительно малое, и растёт медленно.
Это подтверждается (не противоречит) всем имеющимся данным. Если бы заболевших было действительно значительно больше, это вызвало бы перегруз системы здравоохранения, который невозможно было бы скрыть и гораздо более значительное повышение смертности.

1а. Это провал и катастрофа? Нет, наоборот. Были метания и ошибки, но главное — введение карантина — было сделано вовремя и верно.

2. Оценки по выявленным случаям выглядят относительно реалистичными и соответствуют другим похожим странам. Хотя некоторые кривые, особенно по летальности варьируются слишком в узком диапазоне и почти не имеют пиков.
Причины, по которым эпидемия развивается так медленно до конца не ясны. Но это соответствует ситуации по всей Восточной Европе.
— своевременно введённый карантин
— меньше транспортных пересечений
— особенности менталитета.

2а. В последние 1,5 недели темпы развития эпидемии в России однако ускорились. Недавний подъем количества является скорее всего своего рода второй волной, связанной вероятно с менее строгим соблюдением людьми режима самоизоляции.

Продолжение выводов и рекомендации по ссылке.
Тут ребята не согласны с моей оценкой карты со стопкоронавирус.рф и считают, что задача решена прекрасно:

ИМХО, оценивать удачность/неудачность важно исходя из цели, контекста ситуации в которой используется данный чарт. А ситуация на мой взгляд такова, что данный чарт должен создать ощущение, что "шеф, всё пропало", и эту задачу данный чарт решает великолепно. Талантливо выбранная визуализация, где Россия похожа на больного человека, покрытого пятнами кори.
https://t.iss.one/antxt/247

Только вот проблема в том, что выполнение одной задачи не должно вводить читателей в заблуждение относительно других важных вещей, это раз. А сейчас это по сути вообще не визуализация количественных данных, а скорее качественных, где кружок показывает наличие выявленных в регионе. Но тогда от разного размера нужно отказаться вовсе, потому что мы привыкли считывать количество через площадь объектов. Лучше уж тогда одного размера сделать кружки, или просто закрасить регионы, где есть выявленные. А если они есть везде, то это вовсе теряет всякий смысл.

В России далеко не всё пропало, а всё довольно благополучно по коронавирусу в 90% регионов. Это два. То есть визуализация опять-таки вводит в заблуждение.

Ну, и если уж говорить более широко, хотелось бы помимо карты общего количества выявленных, карту за условно последнюю неделю, и лучше в пересчете на число жителей, чтобы понимать, где сейчас реально нужно усиливать эпидемиологические меры.
Немного посложнее попробуем
Милые комиксы на тему визуализации данных и статистики

https://www.boredpanda.com/statistically-insignificant-comics-raf-schoenmaekers/
Алексей Колоколов — кладезь знаний и интересных историй по визуализации корпоративной аналитики. Оказывается он ведёт канал @analyst_club, где делится полезными ссылками, размышлениями и теми самыми интересными историями.

Вот, например, пост о тяжёлых буднях создателей дэшбордов для бизнеса: https://alexkolokolov.com/digital_transform
Я не раз писал в канале о том, как хорошие и даже крутые дизайнеры делают слабую и безграмотную инфографику. Однажды в таком разборе уже засветилась студия Лебедева со своей презентацией для Бауманки.

К сожалению, в отношении представления данных в студии ничего не поменялось. Разберем свежую презентацию для швейцарской криптовалютной комании

Продолжение по ссылке.

#разборыграфиков
Больше Александра Богачева! Поучаствовал в двух видеоподкастах в качестве интервьюируемого. Говорил вроде об одном и том же, но получилось два совершенно разных разговора.
С Ромой Буниным больше показывал и рассказывал о проектах, причем многие до этого вообще никому не демонстрировал и никуда не выкладывал.
С Алексей Малаховским мы обошлись совсем без картинок в разговоре об инфографике, что было для меня в новинку. Получилось больше деталей о жизни и размышлений.

Ссылка на интервью с Ромой (1 час 35 минут): https://www.youtube.com/watch?v=4G3ZvYc0XmY

Таймкоды:
6:02 — Медицинская инфографика — про визуализацию в медицине и почему нет графиков для анализов
23:57 — РИА Новости — про метрики медийных проектов, выбор тем для проектов и упрощение визуализаций для медиа
1:00:51 — Спецпроекты — про подходы к работе с проектом
1:15:05 — Чем занимается сейчас — чем вдохновляется и за чем следит
1:22:31 — Блиц

Ссылки на проекты, которые обсуждаем: https://revealthedata.com/examples/digest/all/primery-rabot-aleksandra-bogacheva/

Ссылка на интервью с Лешей (59 минут):
https://www.youtube.com/watch?v=lJCkQX4UW8Y

Интересные моменты без таймкодов:
— Цифровизация работы участкового врача своими силами
— Как лень и прокрастинация помешали развивать свою студию дизайна и инфографики в Петербурге
— Лучшие российские СМИ по инфографике
— Кто идет учиться дата-журналистике сейчас
— Совет журналистам. Делать инфографику самому или обратиться на аутсорс
Прекрасный, почти эталонный проект по визуализации картографических данных.

Карта возраста домов Петербурга, с крайне увлекательным описанием процесса создания, возможностью купить постер с этой же картой и ссылкой на бесплатный датасет и предложением свободно использовать его в своих проектах.

https://how-old-is-this.house
📈 и 📉

Есть два таких имоджи: растущий график и падающий график.

Я удивлялся, почему они в таких цветах. Почему рост показывается красным, а падение синим? Мы традиционно хорошее показываем зелёным, а плохое — красным. Рост — это обычно хорошо, а падение — это обычно плохо.

Ответ оказался в том, что в Японии красным показывают хорошее, а синим — плохое. Тут ещё есть немного дополнительной путаницы из-за того, что синий в Японии считает оттенком зелёного.

Теперь я удивляюсь тому, что у этих эмоджи до сих пор нет альтернативных вариантов. Есть, например, четыре типа гор: 🌋 🏔 🗻 и три типа компакт-дисков: 💽 💿 📀. А важных вариантов для графиков, которые не вводили бы в заблуждение европейцев нет