data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
939 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Продолжим про пожары в Австралии?

Впечатляющая (как всегда, когда БОЛЬШИЕ данные — прям на весь монитор) работа Reuters — для того, чтобы мы точно поняли масштаб беды. Горит 103 тысячи квадратных километров. Или столько футбольных полей, что только пролистать их в материале — займёт секунд пять.

https://graphics.reuters.com/AUSTRALIA-BUSHFIRES-SCALE/0100B4VK2PN/index.html
Интересный текст о проблеме «недостающих данных». Он о том, что хотя в некоторых областях собирается гигантское количество данных, другие остаются без внимания.

Вот пример: авторы утверждают, что если набрать в гугле слово «рука», то вне зависимости от локации, где вы находитесь, руки будут только белыми. Сразу вспоминается прокол того же Гугла, когда алгоритмы машинного обучения распознали чернокожих на фото как горилл.

Поэтому во всех решениях, которые принимаются на основе анализа массивов данных, важно помнить: действительно ли данные отражают полную картину? Корректно ли изучать так называемого «среднего» человека?

https://eyeondesign.aiga.org/finding-the-blank-spots-in-big-data/
Если вам лень читать, то в тексте есть упоминание одного интересного арт-объекта, который создал художник-исследователь Mimi Onuoha.

Это «Библиотека недостающий данных» — такой шкафчик с папочками. Каждая из них подписана, например: «Количество трансгендерных людей, убитых или получивших увечия из-за нетерпимости» или «Количество американцев без банковских карт», но внутри ничего нет. Как и данных.

https://mimionuoha.com/the-library-of-missing-datasets-v-20
Поговорим про самую популярную кинопремию?

Вчера киноакадемия объявила номинантов на «Оскар-2020», а год назад мы в «Новой» анализировали номинантов за всю историю «Оскара» и выяснили вот какие вещи:

1. Номинанты становятся всё старше. С 1967 года, когда случился «Новый Голливуд» и американское кино получило много новой крови, медианный возраст потенциальных обладателей Оскара растёт. В прошлом году пик как раз пришёлся на 2019 год, о ситуации в этом — не знаю.

2. Женщин не пускают в престижное американское кино. Если не считать актёрские награды, то номинанток в «Оскаре» — кот наплакал. В последние годы ситуация меняется лишь отчасти: женщин становится больше, например, среди художников по гриму. Но вот операторы-женщины и режиссёры-женщины среди номинантов — по-прежнему единороги.

3. Чернокожих мало, и хотя их доля среди номинантов растёт, это больше похоже на «показуху»: повысить их долю пытаются за счёт актёров, в других же категориях ситуация сильно не меняется.

Текст:
https://vk.cc/afdKIW
Открылась регистрация на хакатон, который делают Теплица социальных технологий совместно с «Новой».

Если вы давно читаете канал и всегда хотели попробовать тоже сделать какую-нибудь дата-историю, хакатон – это отличный шанс начать! Здесь можно найти команду, которая поможет довести проект до ума, а также поработать с менторами, которые и идею отшлифуют, и с технической частью помогут.

Опытные же участники получат возможность выиграть 110 тысяч рублей на дальнейшую работу над проектом.

Февральский хакатон пройдёт в Питере, регистрируйтесь и приходите: https://projector2020.te-st.ru/
Скроллителинг на The Guardian про то, в каком возрасте мы теряем своих родителей (окей, статистика дана для Американцев)

С отцами прощаются раньше по двум причинам:
1) Мужчины в среднем умирают раньше
2) Мужчины в более позднем возрасте создают семью

https://www.theguardian.com/news/datablog/2020/jan/19/poor-and-black-americans-more-likely-to-experience-death-parent-younger-age
Чудесная работа о том, как разные народы включали звёзды в разные созвездия. Например, мы привыкли относить Сириус к созвездию Большого Пса, а в некоторых культурах его считали частью орла. Внутри для разных звёзд можно посмотреть образы, с которыми их соотносили!

Датавиз же вот о чём. Не все звёзды включают в созвездия: как правило, чем ярче звезда, тем больше вероятность, что её куда-нибудь отнесут. Но есть и исключения: например, Пояс Ориона или Плеяды. Они создают запоминающиеся формы, поэтому чаще становились предметом внимания первых астрономов.

https://www.datasketch.es/may/code/nadieh/
Коллеги из канала «Сам бы так нарисовал» интересно пишут про современное искусство, и вот про нашу тему.

Из данных можно создавать истории и красиво их оформлять, а можно просто превращать данные в хаотичный, но прекрасный (!) арт. Один из художников, который этим занимается, Рефик Анадол, в своём интервью подробнее рассказывает, как создаются такие работы:

https://t.iss.one/mazznya/87
У The Bell вышел текст про десятилетнюю борьбу Центробанка и налоговой с обналом — https://thebell.io/strana-nalichnyh-kak-vlasti-10-let-borolis-s-obnalom-i-kto-pobedil/

Внутри есть и графики, и объяснения, как вообще этот обнал устроен. Интересный момент, что в итоге бизнес хлебнул горя из-за всех предпринятых мер.

Текст стоит почитать еще и потому, что вы поймете больше про нового главу правительства Мишустина, который как раз пришел на новую должность из ФНС.
Любовь Поповец в своём новом микро-медиа Call Me Data сравнивает творческий путь Ван Гога и Достоевского и говорит, что похожие жизненные обстоятельства порождают также схожие идеи в творчестве.

В исследовании, конечно, есть анализ данных — темы, которые занимали обоих авторов, нашлись в дневниках Достоевского, а также письмах Ван Гога к брату:

https://lyubov9995.wixsite.com/arttinder-gogh-dost
Если вы хотите поучаствовать в хакатоне «Новой газеты» и «Теплицы социальных технологий» 15-16 февраля в Питере, а идеи для проекта нет, тогда загляните вот сюда — https://projector2020.te-st.ru/projects/

Разные НКО, парнеры хакатона, приготовили свои задачи для участников. Поэтому не торопитесь сливаться. Вдруг какая-то идея зацепит, и вы захотите реализовать ее.
Люблю истории, когда дата-журналистика меняет мир.

New York Times делали исследование о кроссовках Nike Zoom Vapofly и показали, что они значительно улучшают результаты бегунов.

Журналисты использовали данные спортивного приложения Starva, в котором бегуны указывают дистанцию, время её преодоления, а также зачастую модель кроссовок.

И вот сегодня Медуза пишет, что Международная ассоциация легкоатлетических федераций чуть не запретила кроссовки – над этим в течение нескольких месяцев думала целая группа специалистов.

В итоге пришли к тому, что Vapofly запрещать не будут, но до окончания Олимпиады 2020 года в более новых моделях кроссовок с продвинутымм технологиями бегать запретят.
Дата-отдел «Новой газеты» о летальности и «заразности» коронавируса и еще нескольких инфекционных заболеваний XXI века
Где находится новый китайский коронавирус на шкале от обычной простуды до Эболы?

Сравнили летальность и «заразность» 2019-nCoV и еще нескольких крупных инфекционных заболеваний XXI века.

☣️ SARS (начало вспышки: 2002 год) – тяжелый острый респираторный синдром. 8 тысяч случаев, 800 смертей.

☣️ Птичий грипп (начало вспышки: 2003 год) – 861 случай, 455 смертей.

☣️ MERS (начало вспышки: 2012 год) – ближневосточный респираторный синдром, 2250 случаев, 850 смертей.

☣️ Эбола (начало вспышки: 2014 год) – 3296 случаев, 2194 смерти.

☣️ 2019-nCoV (начало вспышки: 2019 год) – 7921 случай, 170 смертей.

Комментарии экспертов
➡️ https://bit.ly/2UaVUsO
This media is not supported in your browser
VIEW IN TELEGRAM
Да-да, вас уже, возможно, бесит коронавирус, но тут кое-что интересное: аналитик Геворг Егикян на примере Еревана показывает, как несколько важных мер помогают снизить распространение эпидемии.

Шаг 1: пускаете меньше автобусов, чем обычно
Шаг 2: вводите карантин в нескольких местах наибольшего скопления жителей

Готово! Вы восхитительны: спрятаться от вируса полностью не удалось, но заражённых в разы меньше.

https://lexparsimon.github.io/coronavirus
Вот вам ещё дополнение к предыдущей новости, которое присылает внимательный читатель Natalia Toganova:
«...плохой вариант предложен. Пример с запретом общественного транспорта — классический. В Африке так делали. В результате люди все равно ехали, но на менее безопасных средствах передвижения. Или переполненный автобус попадает в аварию».

Это меня, к слову, пугает — это не первый случай, когда мне пишут, что анализ в материалах недостаточно полон или корректен. А ведь здесь даже не журналист работу делал — аналитик, специализирующийся на городах!

Увы, опасная сторона дата-журналистики — легко создать убедительный для большинства читателей тезис, который оказывается ошибочным, потому что авторы не имеют достаточной квалификации или достаточного количества времени, чтобы правильно провести исследование. Поэтому в любой важной теме, конечно, важно показывать наработки экспертам. Но и эксперт не всегда может достаточно глубоко вникнуть в работу журналиста.
Яндекс выпустил новое пёстрое исследование про тренды красоты: волосы стали короче, но зато чаще — крашеными; мужчины стали чаще ухаживать за собой, а брови стали интереснее, чем глаза.

Больше инсайтов:
https://yandex.ru/company/researches/2020/beauty