data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
939 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Очень уместное применение моизаичной диаграммы: FT в своём материале рассказывает, что не так с электоральными системами Великобритании и Соединённых Штатов.

Если давать каждому Штату одинаковый вес голоса, то получившийся результат будет плохо представлять голосование населения в целом, а особенно — отдельных социальных групп, потому что люди распределены по стране крайне неравномерно.
По этой причине некоторые «консервативные» идеи получают больше поддержки, чем имеют в обществе на самом деле.

Читать либо под VPN, либо оригинальную ссылку под Bypass Paywalls
👍9🔥4🤡3👎2😢1
«Новая газета. Европа» в графиках объясняет, что происходит с «зерновой сделкой», и почему Россия то выходит из неё, то быстро возвращается.

На картинке, которую можно назвать «сердцем» работы, показана ситуация с проверкой украинских судов с зерном:
«Если в августе на инспекцию одного сухогруза в среднем уходило менее трех дней, то в сентябре — уже почти девять, а в октябре — более тринадцати»

https://novayagazeta.eu/articles/2022/11/04/kremlevskaia-dieta (только под VPN)
17👍8🤡3🤯1🍓1
Джорджия Люпи вместе со своей командой сделала дата-арт, посвящённый некоммерческой организации Twist Out Cancer.

НКО занимается тем, что поддерживает больных раком при помощи искусства — несколько месяцев с ними общаются художники и создают работы, рассказывающие историю болезни каждого конкретного человека.

За 10 лет организация связала между собой более 600 людей: художников, больных, предрасположенных к раку и ухаживающих за ними людей. Каждый человек на большой визуализации отмечен мазком кисти, а связанные между собой мазки — связаны совместной художественной работой.

Полную визуализацию можно будет увидеть в книге Brushes With Cancer или в музее WNDR в Чикаго.

Но кое-что можно рассмотреть и нам и повосхищаться:
https://www.pentagram.com/work/twist-out-cancer/story
10👏3🥰2👍1🤯1
Проект «Если быть точным» рассматривает демографические прогнозы для России и все они — грустные.

Самый оптимистичный прогноз даёт Институт демографии НИУ ВШЭ: по мнению исследователей к 2100 году в России будет жить 137,5 миллионов человек.
Другие организации дают оценки куда ниже. Средний прогноз ООН — 112,2 миллионов человек. Прочие предлагают вилку от 106,4 млн человек (IHME) до 121,8 (IIASA).

Cправедливости ради, уже по графику заметно, что Россия в своей проблеме не одинока — в рейтинг самых населённых врываются сплошь развивающиеся страны. Но у нашей страны есть и свои демографические особенности.

Авторы пытаются понять, насколько можно верить этим прогнозам, и почему в России так стремительно может уменьшаться население.

https://tochno.st/materials/v-rossii-sereznye-problemy-s-demografiey-i-sovsem-ne-iz-za-lgbt-ili-chayldfri-obyasnyaem-na-pyati-grafikakh-stoit-li-nam-boyatsya-vymiraniya
🔥8👍3🤨3
Media is too big
VIEW IN TELEGRAM
Антон Мизинов сделал генератор красивых таймлайнов на платформе Observable.
Можно загрузить свои данные, покрутить настройки, а результат потом дополнительно красиво обработать в графическом редакторе.

Сохранять так — навестись на картинку, найти слева три точки, далее в меню — Download SVG.
Cпасибо автору за наводку :)

https://observablehq.com/@mizinov/timeline
🔥18👏6👍2
Пост-знакомство

У нас сегодня маленький праздник — число участников перевалило за 5 тысяч! 🥳

В честь круглой цифры хочу сделать пост-знакомство: расскажу немного о канале и о его авторах.

Что вы читаете? Этот канал появился после второго хакатона «Новой газеты» в 2019 году. Наш дата-отдел в лице меня, Алеси Мароховской и Иры Долининой решил, что 150 человек аудитории не должны пропадать зря, и сюда можно писать о наших работах и классных работах наших коллег. Так появился Дата-блог «Новой».
Спустя год все авторы канала окончательно перестали иметь отношение к «Новой газете», и мы решили провести ребрендинг. Алеся придумала название data.csv, а я сгенерил дата-арт на аватарку :)

Кого вы читаете? Так получилось, что в последнее время в канал преимущественно пишу я. Какое-то время помогала Алеся, но в последний год ей стало особенно трудно — сначала иноагентский статус, а затем «Важные истории», где Алеся работает редактором дата-отдела, признали нежелательной организацией. До начала полномасштабной войны ребята делали бесплатные уроки по дата-журналистике, а сейчас гораздо больше сконцентрированы на основной задаче — серьёзных журналистских расследованиях.

Расскажу о себе. Я — дата-журналист. Работал в РБК, «Новой газете», Студии инфографики РИА, Тинькофф Журнале, а сейчас тружусь в команде Исследований Яндекса.
Преподаю и веду тренинги по журналистике и визуализации данных.

Самые любимые работы, которыми я занимался:
* В погоне за Оскаром — о том, почему на Оскар не обязательно номинируют самые гениальные фильмы
* Сколько вы зарабатываете по сравнению с коллегами противоположного пола — как отличаются зарплаты мужчин и женщин в резюме, и что на это влияет
* Судьи держат нас за болванку — почему российские судьи «копипастят» свои же судебные решения

Если вы хотите как-то посотрудничать: например, заказать тренинг по визуализации данных и дата-сторителлингу для вашей организации или сделать совместное исследование — пишите, обудим :)
🎉6818👍8🔥8
Ностальгией накрыло 🥲
Ставьте 🌚, если тоже поняли отсылку

По ссылке — статья о том, как отличается транспортный налог в разных регионах России. Я обычно в такое не захожу, потому что мне скучно, но виз гениальный.

https://journal.tinkoff.ru/autonalog-stat/
🌚96😁6😢3🤔2
Media is too big
VIEW IN TELEGRAM
Не совсем дата, но уж слишком классная мультяшная инфографика от Washington Post, которая рассказывает, как солнце позволяет корректировать наши ежедневные ритмы, и что может поломать в этих ритмах переход на другое время.

https://www.washingtonpost.com/wellness/interactive/2022/permanent-standard-time-body-health-benefits/
🔥4🥰2
Вся простота жизни в одной картинке: проект Flowing Data визуализировал данные опроса American Time Use Survey об удовлетворённости жизнью и увидел очень интересную закономерность.

Но что-то мне подсказывает, что в России результаты были бы другими 😄

https://flowingdata.com/2022/11/10/life-satisfaction-and-age/
👍20🤔9👎3🤯2😁1
Посмотрел новое видео Максима Каца, где он рассказывает, что президент в последнее время старается не быть слишком медийным, и о главных новостях в России сейчас всё чаще рассуждают и сообщают другие люди.

Стало интересно, отражается ли это как-то в поисковом интересе к политическим персонам.
Взял самого Путина и для сравнения — двух самых громких, на мой взгляд, его союзников — Рамзана Кадырова и Евгения Пригожина.

Ну и выяснил: ищут президента России в целом как и обычно — с 24 февраля поисковый интерес к Путину даже ни разу не пробил минимум за последние пять лет.
А соревноваться с ним за лидерство в инфополе пока никто из других политических фигур, кажется, сейчас не может.

Навальному, кстати, удавалось несколько раз быть интереснее в поиске, но это уже другая история :)
👍29👎1🤔1
Не реклама, а жаль 😄

На Domestika есть очень много соблазнительных курсов про визуализацию данных, и на днях появился ещё один — о том, как делать красивую инфографику в иллюстраторе от дата-художника Valentina D'Efilippo.

Валентина делает действительно красивые вещи, хоть и с уклоном в дата-арт, а не понятность. В комментарии скину визуализацию про воины в виде маков, которую вы могли видеть :)

Курс стоит копейки — около 1300 рублей на наши деньги, однако есть большой подводный камень — с российской карты расплачиваться больше нельзя.

https://www.domestika.org/en/courses/3601-information-design-storytelling-with-data-in-illustrator

В комментариях пишут полезное:
Можно платить со счета Эппл айди, на который можно закинуть с симки МТС. По крайней мере так можно было в марте, я последний раз покупала там курс тогда
Есть подвох - это нужно делать обязательно через приложение доместики, а там цена выше и не работают пакетные предложения
11👍3👎1🔥1😁1
Красивый спецпроект Axios, который рассказывает, как часто персонажами фильмов вселенной Мстителей становились женщины и представители других рас.

Листать очень приятно, получился настоящий дата-комикс 🌿

https://www.axios.com/marvel-cinematic-universe-diversity
👍11🔥3🌭2😱1
Российские суды, конечно, давно не про правосудие. А скорее про то, чем еще они смогут удивить нас. В этот раз @istories_media обнаружили, что участие в войне с Украиной — теперь смягчающее обстоятельство в суде!
В тексте любопытные истории, как это теперь работает.

https://storage.googleapis.com/istories/stories/2022/11/18/priobrel-nemnogo-marikhuani-obmenyav-na-sukhie-paiki-dlya-soldat/index.html
🥴18👍6🤮6💩4🔥31
Ой, кайф. Студия дизайна VisualMethod придумала скрестить героев сериала «Офис» с видами графиков, и попросила нейросеть нарисовать, что получится.

Какой у вас любимый персонаж?)
https://vc.ru/marketing/533023-esli-by-grafiki-byli-sotrudnikami-ofisa-9-primerov-iz-neyroseti
😁6👍5💩5🤯2
Cразу два кайфовых приёма дата-сторителлинга в материале Т—Ж. Вроде обычный текст о том, где в Москве и Питере живёт больше людей.

Но вместо того, чтобы сразу начать с рейтинга, автор рассказывает о живом: берёт два похожих по населению, но разных по структуре района, и показывает их застройку.

Самое классное, что можно было ограничиться данными о доле жилых домов и парков, но дизайнеры решили нарисовать подробный план застройки, близкий к оригиналу. И теперь это не просто циферки, которые хочется пролистать, а притягательная картинка, которая позволяет понять, как в этих районах живут.

https://journal.tinkoff.ru/tesno-stat/
🥰29👍16🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Дмитрий Муратов в сегодняшнем интервью Дудю рассказывает про чудесное исследование, в котором мне посчастливилось поучаствовать, когда я работал в «Новой газете».

Тогда мы изучали тексты судебных решений и выяснили, что часть судей позволяет себе копипаст — буквально копирует текст приговора одному человеку, заменяет там время, место и имя и выдаёт как приговор другому человеку.

Самая «копируемая» (по числу дел) статья УК — 228 (наркотическая). В 18% решений по этой статье есть элементы копипаста. С одной стороны это и понятно — наркотические дела все как одно, что и вызывает соблазн скопировать предыдущее решение.
С другой стороны, при таком подходе есть риск, что судья недостаточно серьёзно отнёсся к самому делу, не рассмотрел улики и аргументы сторон.

Любопытно, что доля копируемых судебных решений не зависит от обилия наркоманов в районе — если мы возьмём два соседних района Петербурга, где вряд ли может быть большая разница в таких делах, то увидим, что процент копипаста в районных судах может сильно отличаться.
Это значит, что подход к делу зависит в первую очередь от честности судей, а не от похожести дел.

https://novayagazeta.ru/articles/2019/03/20/79929-sudi-derzhat-nas-za-bolvanku

P.S. В интервью, конечно, не совсем правда. Приговоры совпадали не на 100%, как говорит Муратов — речь шла скорее об абзацах текста, которые почти дословно совпадали.
👍31🔥122🤔2
Что снится россиянам после 24 февраля

Исследовательница Любовь Поповец изучила данные о ~1000 снах россиян. Выяснила, что самый популярный персонаж там — Путин (и здесь победил!), а более половины респондентов рассказывают, что испытывают во сне страх и пытаются что-то делать, но безуспешно.

В статье есть занятные описания снов и сюррелистичные картинки, сгенерированные нейросетью.

Правда, в голове надо держать, что выборка явно обладает определёнными особенностями: почти половине респондентов нет и 25, и почти все из них живут в миллионниках. Неудивительно, что при таком раскладе из городов им чаще всего снятся Москва и Петербург.

https://readymag.com/u94255285/wardreams/
👍13💩9😁32👎2😢1
Агенство Aljazeera с одной стороны известно разжиганием ненависти на Ближнем Востоке, а с другой, как оказалось, имеет сильную инфографическую команду.

Там написали свой предсказатель результатов чемпионата мира по футболу и красиво визуализировали исторические данные о победах.

https://www.aljazeera.com/wc2022experience/
👍9💩81🤯1
Если новую инфографику коллег из Т—Ж я здесь часто оставляю с комментариями «смотрите, как клёво они придумали!», то у соседнего проекта Tinkoff Data графики очень часто сложные и с ошибками 😔

Разберём несколько типовых из свежего исследования про Чёрную пятницу:

1️⃣ Сортировка!
Базовая установка инфографера — упростить жизнь читателю и не заставлять его много думать. «Умная» сортировка в этом очень помогает — мы сразу можем понять, какие товары стали покупать чаще, а какие — реже.

Сортируют чаще всего по одному из значений или по дате. Иногда уместна сортировка по алфавиту, но это случается реже.

2️⃣ Применение линейного графика
Базовое правило — используем линейный график только для непрерывных данных. В 99% случаев — для изменения во времени.
На второй картинке — грубая ошибка, салоны красоты не могут перетекать в бытовую технику.

3️⃣ Неудачные подписи на «линейном» графике
Здесь единого правила нет, и главная проблема вытекает из того, что линейный график мы привыкли читать как время.
Из-за подписей событий кажется, что где-то в середине графика — ноябрь, потому что там написано «Чёрная пятница»

4️⃣ Неправильные подписи оси на первом графике?
Я не сразу понял, чем первая картинка отличается от второй — помог полный текст исследования.

Кажется, на первом графике изображено абсолютное число покупок. Заголовок очевидно должен навести на эту мысль, но ось говорит — x12. Значит, что-то выросло в 12 раз. В чёрную пятницу в 12 раз больше покупали товаров в категории «Дом, ремонт», да? Видимо, нет(

На сайте, кстати, этой оси вообще нет, и такой вариант намного лучше.
Несколько мыслей, как лучше поступить, если общее количество покупок разглашать нельзя:

* Показать процент от общего числа покупок в эти даты. Хороший пример у Яндекса
* Не делать вообще никаких подписей
* Убрать оси и работать только с аннотациями
* Придумать подписи, которые не будут явно ассоциироваться с приростом. 12 у.е.? 😄

P.S. Если это читают авторы и хотят что-то глобально поменять, напишите мне — подумаем вместе 🌿
🔥38👍172😱1