Мне недавно на курсе прислали очень прикольный график в блоке про графики, вводящие в заблуждение.
Он поднимает важную и до боли частую проблему выбора интервалов – разные группировки дают совершенно разные картинки и распределения. Тут, конечно, не равные интервалы, а скорее группировки, но картинка порадовала.
Я больше всего за то, чтобы комбинировать разные графики: гистограмма + barcode / jitter график. Особенно, если на основании этих интервалов сделана раскраска хороплет карты – для таких классно делать легенду карты через график распределения.
Визуализация распределений не ограничена только гистограммами, есть разные способами, в том числе добавила подборку из Fundamentals of Data Visualization и прекрасные raincloud plots от Cedric Scherer.
ps в курсе на степике есть задачки на разбор и переделку графиков с обратной связью, а в конце можно сделать свой проект и итеративно поправить его вместе со мной. С ноября будет небольшое повышение стоимости, а если вы студент – пишите, придумаю скидку)
Он поднимает важную и до боли частую проблему выбора интервалов – разные группировки дают совершенно разные картинки и распределения. Тут, конечно, не равные интервалы, а скорее группировки, но картинка порадовала.
Я больше всего за то, чтобы комбинировать разные графики: гистограмма + barcode / jitter график. Особенно, если на основании этих интервалов сделана раскраска хороплет карты – для таких классно делать легенду карты через график распределения.
Визуализация распределений не ограничена только гистограммами, есть разные способами, в том числе добавила подборку из Fundamentals of Data Visualization и прекрасные raincloud plots от Cedric Scherer.
ps в курсе на степике есть задачки на разбор и переделку графиков с обратной связью, а в конце можно сделать свой проект и итеративно поправить его вместе со мной. С ноября будет небольшое повышение стоимости, а если вы студент – пишите, придумаю скидку)
❤38
Прислали очень красивое про 7 чудес света. Из 7 сейчас осталась только пирамида Гизы – причем это первое чудо из всех 7!
Эти объемные rayshader карты в самое сердечко каждый раз. Что это за карты такие тут.
Эти объемные rayshader карты в самое сердечко каждый раз. Что это за карты такие тут.
❤55
Напомню про свой любимый сервис полезных материалов по статистике и анализу данных STHDA. Точнее, так я их знала, а теперь они потихоньку переезжают на Data Novia.
Множество тьюториалов по стат тестам и созданию визулизаций на R. Но даже и без R – это хороший ресурс быстро погрузиться в методы. Что классно - графики они тоже обычно доводят до хороших, не бросают на базовых форматах: думают и про цвет и подложку.
Что из полезного вспомнилось:
- Статистические тесты
- Корреляции
- Кластеризация
- Регрессии
- Графики для публикаций
- Введение в ggplot2
Множество тьюториалов по стат тестам и созданию визулизаций на R. Но даже и без R – это хороший ресурс быстро погрузиться в методы. Что классно - графики они тоже обычно доводят до хороших, не бросают на базовых форматах: думают и про цвет и подложку.
Что из полезного вспомнилось:
- Статистические тесты
- Корреляции
- Кластеризация
- Регрессии
- Графики для публикаций
- Введение в ggplot2
❤74
Для фанатов Тейлор Свифт про сложность текстов ее песен. Справа более "простые" песни, с большим количеством повторяющихся строк, слева – более "сложные.
🎧 Мы с Колей делали похожее по русской музыке: https://t.iss.one/nastengraph/2982
Вдохновлялись тоже через проект от The Pudding
🎧 Мы с Колей делали похожее по русской музыке: https://t.iss.one/nastengraph/2982
Вдохновлялись тоже через проект от The Pudding
❤54
Пытаюсь заманить вас смотреть Формулу 1 вместе со мной! 🏁
❣️Почему может понравиться (хотя я даже водить не люблю):
- Маленькие команды! Не надо запоминать кучу людей, как в футболе, всего 2 человека на команды = 20 гонщиков
- Жизнь этих 20 начинает очень интересовать, скандалы расследования, дружба за пределами трассы и переходы между командами
- Куча рекордов, регулярно! Недавно Макларен обновили рекорд, проведя пит-стоп за 1.8 секунд! Попробуйте в голове посчитать от 1 до 2 и понять, насколько это быстро
- И всегда красивейшие бамп чарты, потому что на таком количество людей они не выглядят мешаниной
📌Ссылка поизучать
❣️Почему может понравиться (хотя я даже водить не люблю):
- Маленькие команды! Не надо запоминать кучу людей, как в футболе, всего 2 человека на команды = 20 гонщиков
- Жизнь этих 20 начинает очень интересовать, скандалы расследования, дружба за пределами трассы и переходы между командами
- Куча рекордов, регулярно! Недавно Макларен обновили рекорд, проведя пит-стоп за 1.8 секунд! Попробуйте в голове посчитать от 1 до 2 и понять, насколько это быстро
- И всегда красивейшие бамп чарты, потому что на таком количество людей они не выглядят мешаниной
📌Ссылка поизучать
❤69
Brian Moore про Властелин Колец в попытке найти, а кто действительно главный герой трилогии на основании сказанных слов, появлений на экране и взаимрдействий.
ps табло гики, советую обязательно подсмотреть, что все картинки героев – не картинки, а полигоны! Прям очень необычно.
ps табло гики, советую обязательно подсмотреть, что все картинки героев – не картинки, а полигоны! Прям очень необычно.
❤85
Продажи музыки в разных форматах от Visual Capitalist 🎧
Эти данные визуализировали уже кучу раз, каждый раз хороша для них смотрятся и просто диаграммы с областями и стримграфы.
Эти данные визуализировали уже кучу раз, каждый раз хороша для них смотрятся и просто диаграммы с областями и стримграфы.
❤62
Steve Wexler в блоге про то, когда линий на линейном графике слишком много.
“Золотое” правильно – 4-5 линий на график. Когда их больше и если тренды линий сильно пересекаются, то есть вероятность получить все равно спагетти чарт, потому что линии пересекутся слишком сильно.
Предлагает старое доброе:
- все линии серым и подсвечивать нужные
- много маленьких графиков плиткой
От себя добавлю:
- много графиков друг под другом - так проще сравнивать динамику относительно друг друга
- сравнение со средним, последнее время часто его добавляю. Вместо среднего может быть и 90 (или какой-то еще) процентиль, медиана, иногда минимум или максимум, смотря, что поможет добавить “контекста” для выбранного тренда
По этому поводу обновила таблошку
“Золотое” правильно – 4-5 линий на график. Когда их больше и если тренды линий сильно пересекаются, то есть вероятность получить все равно спагетти чарт, потому что линии пересекутся слишком сильно.
Предлагает старое доброе:
- все линии серым и подсвечивать нужные
- много маленьких графиков плиткой
От себя добавлю:
- много графиков друг под другом - так проще сравнивать динамику относительно друг друга
- сравнение со средним, последнее время часто его добавляю. Вместо среднего может быть и 90 (или какой-то еще) процентиль, медиана, иногда минимум или максимум, смотря, что поможет добавить “контекста” для выбранного тренда
По этому поводу обновила таблошку
❤51
❤23