настенька и графики
26K subscribers
2.47K photos
77 videos
15 files
3.12K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
Мне недавно на курсе прислали очень прикольный график в блоке про графики, вводящие в заблуждение.

Он поднимает важную и до боли частую проблему выбора интервалов – разные группировки дают совершенно разные картинки и распределения. Тут, конечно, не равные интервалы, а скорее группировки, но картинка порадовала.

Я больше всего за то, чтобы комбинировать разные графики: гистограмма + barcode / jitter график. Особенно, если на основании этих интервалов сделана раскраска хороплет карты – для таких классно делать легенду карты через график распределения.

Визуализация распределений не ограничена только гистограммами, есть разные способами, в том числе добавила подборку из Fundamentals of Data Visualization и прекрасные raincloud plots от Cedric Scherer.

ps в курсе на степике есть задачки на разбор и переделку графиков с обратной связью, а в конце можно сделать свой проект и итеративно поправить его вместе со мной. С ноября будет небольшое повышение стоимости, а если вы студент – пишите, придумаю скидку)
38
Прислали очень красивое про 7 чудес света. Из 7 сейчас осталась только пирамида Гизы – причем это первое чудо из всех 7!

Эти объемные rayshader карты в самое сердечко каждый раз. Что это за карты такие тут.
55
Напомню про свой любимый сервис полезных материалов по статистике и анализу данных STHDA. Точнее, так я их знала, а теперь они потихоньку переезжают на Data Novia.

Множество тьюториалов по стат тестам и созданию визулизаций на R. Но даже и без R – это хороший ресурс быстро погрузиться в методы. Что классно - графики они тоже обычно доводят до хороших, не бросают на базовых форматах: думают и про цвет и подложку.
Что из полезного вспомнилось:
- Статистические тесты
- Корреляции
- Кластеризация
- Регрессии
- Графики для публикаций
- Введение в ggplot2
74
Для фанатов Тейлор Свифт про сложность текстов ее песен. Справа более "простые" песни, с большим количеством повторяющихся строк, слева – более "сложные.

🎧 Мы с Колей делали похожее по русской музыке: https://t.iss.one/nastengraph/2982

Вдохновлялись тоже через проект от The Pudding
54
Пытаюсь заманить вас смотреть Формулу 1 вместе со мной! 🏁

❣️Почему может понравиться (хотя я даже водить не люблю):
- Маленькие команды! Не надо запоминать кучу людей, как в футболе, всего 2 человека на команды = 20 гонщиков
- Жизнь этих 20 начинает очень интересовать, скандалы расследования, дружба за пределами трассы и переходы между командами
- Куча рекордов, регулярно! Недавно Макларен обновили рекорд, проведя пит-стоп за 1.8 секунд! Попробуйте в голове посчитать от 1 до 2 и понять, насколько это быстро
- И всегда красивейшие бамп чарты, потому что на таком количество людей они не выглядят мешаниной

📌Ссылка поизучать
69
Brian Moore про Властелин Колец в попытке найти, а кто действительно главный герой трилогии на основании сказанных слов, появлений на экране и взаимрдействий.

ps табло гики, советую обязательно подсмотреть, что все картинки героев – не картинки, а полигоны! Прям очень необычно.
85
Продажи музыки в разных форматах от Visual Capitalist 🎧

Эти данные визуализировали уже кучу раз, каждый раз хороша для них смотрятся и просто диаграммы с областями и стримграфы.
62
Красиво сделано – высота зданий в Пекине.
68
Steve Wexler в блоге про то, когда линий на линейном графике слишком много.

“Золотое” правильно – 4-5 линий на график. Когда их больше и если тренды линий сильно пересекаются, то есть вероятность получить все равно спагетти чарт, потому что линии пересекутся слишком сильно.

Предлагает старое доброе:
- все линии серым и подсвечивать нужные
- много маленьких графиков плиткой

От себя добавлю:
- много графиков друг под другом - так проще сравнивать динамику относительно друг друга
- сравнение со средним, последнее время часто его добавляю. Вместо среднего может быть и 90 (или какой-то еще) процентиль, медиана, иногда минимум или максимум, смотря, что поможет добавить “контекста” для выбранного тренда

По этому поводу обновила таблошку
51
Интересное решение от Nathan Yau про изменение основных причин смертей в США.

И его старый, похожий проект про то же самое, но уже с разбивкой по типам и окраской по частотности.
23