data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
941 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Мы делились недавно материалом, где рассказывали, как запуск ракет влияет на движение самолётов.

Но есть и другие факторы, которые мешают выбирать самые короткие маршруты из точки A в точку B: например, проблемы безопасности и политические конфликты.

Подробнее о том, как на самом деле летают самолёты, в крутом data-driven проекте:
https://multimedia.scmp.com/news/world/article/2165980/flight-paths/index.html
Китайские туристы – это сила! Их много, а ещё они не скупятся на траты в поездках, поэтому власти Китая нередко используют запрет на туризм в качестве санкций для стран-обидчиков.

Китайцы богатеют и начинают чаще ездить в поездки. А осложнение отношений с США делает Россию всё более популярным местом для поездок — доля туристов из Поднебесной стремительно растёт.

Больше об этом в картинках и буквах на Эконс:

https://econs.online/articles/opinions/chto-dvizhet-kitayskimi-turistami/
К слову об удобстве сайта Росстата, который обновился «впервые за 20 лет». Как вы думаете, чем отличается файл doc от docx?

Правильный ответ — в doc-файле вообще не лежат данные, там дано определение понятия «Заработная плата».
̶Е̶с̶л̶и̶ ̶д̶у̶м̶а̶е̶т̶е̶ ̶з̶а̶в̶е̶с̶т̶и̶ ̶р̶е̶б̶ё̶н̶к̶а̶,̶ ̶п̶о̶с̶м̶о̶т̶р̶и̶т̶е̶ ̶с̶н̶а̶ч̶а̶л̶а̶

FlowingData визуализировали данные опросов о том, как люди проводят время, и рассказывают, что меняется в жизни с появлением ребёнка.

https://flowingdata.com/2019/06/14/kids-nokids/
Ааааа! Смотрите!

Это The Pudding при помощи машинного обучения визуализировали обложки самых продаваемых книг за 11 лет (использовали специальный алгоритм, который расставил картинки так, чтобы они лучшим образом сочетались по цветам).

Ещё они автоматическим образом определили пол автора и возможную тему (по обложке), а также стандартизировали жанры – по этим параметрам можно фильтровать книги и подобрать себе что-нибудь в список «что бы почитать» 🙃

Ну и конечно – это в первую очередь про красивую картинку – просто поставьте фильтр по полу автора и посмотрите на результат.

https://pudding.cool/2019/07/book-covers/
О, забавный сюжет вышел у РБК. Они обнаружили, что в год перед выборами стабильно растёт ожидаемая продолжительность жизни в России, а после — сразу падает.

Но вы помните, что корреляция не всегда показывает причинно-следственную связь, да? Вот и журналисты обратились к Росстату, который эти данные публиковал, и Росстат сказал — «виновата погода». Звучит даже разумно!

https://www.rbc.ru/economics/05/07/2019/5d1de6c59a79475585ea976f
Написали о том, как руководители предприятий совершают «общественно опасные» (цитата) деяния — проводят через бухгалтерию штрафы, которые были наложены на них как на должностные лица.

Вот пример: инспектор по пожарной безопасности находит в больнице какие-нибудь неправильно установленные огнетушители, выписывает главврачу штраф 2000, тот даёт бухгалтеру распоряжение — этот штраф оплатить, и за это ему (главврачу) прилетает условный срок.

И всё бы хорошо, но с судимостью карьерные возможности резко сужаются. Помните же, что многие организации (в особенности — государственные) требуют справку об её отсутствии?

Судьи тоже осознают абсурд таких дел, и, кажется, не очень понимают, какое наказание выбрать — мы не выявили зависимости между общим размером штрафов, который осуждённые оплачивали «из кармана» организации и наказанием, которое они за это получили.

https://www.novayagazeta.ru/articles/2019/07/03/81119-melkie-prestupniki
1 июля 1997 года Гонконг перестал быть колонией Великобритании и стал специальным административным районом Китая с собственным законодательством.

В этот день каждый год проходят торжественные мероприятия, но и неизменно находятся люди, которые превращают праздничные шествия в столкновения и пытаются выразить протест.

На этот раз демонстрации окончательно смешались с мирными шествиями – это всё из-за законопроекта, который позволит властям Гонконга «выдавать» Китаю людей, которые нарушили законы КНР.

Масштабные митинги против этого закона проходили помимо 1 июля ещё трижды – 21 и 26 июня, а также 7 июля. Bloomberg в цифрах и картах рассказывает, чем отличались эти демонстрации:

https://www.bloomberg.com/graphics/2019-changing-tactics-of-hongkong-protests/
(как всегда – если кончился лимит – режим инкогнито вам в помощь)
Анализ данных может изменить мир!

Исследователи из The Truth Initiative посмотрели 350 часов популярных сериалов на Netflix и американском ТВ и выяснили, что герои картин курят всё чаще и чаще, причём более 2/3 сцен употребления табака приходятся на продукты Netflix.

Развлекательная компания уже обратила внимание на исследование и выступила с официальным заявлением — в новых сериалах герои будут дымить только если это действительно будет необходимо. Например, чтобы показать историческую действительность или подчеркнуть образ определённого персонажа.

https://www.truthinitiative.org/research-resources/tobacco-pop-culture/while-you-were-streaming-smoking-demand
Психоделичные карты в свежем исследовании Яндекса про туризм.

Кроме них там — рейтинг стран по туристическим запросам, рассказ о влиянии кризиса 2014 года на популярные у российских туристов направления, а также карта «схожести» туристических городов.

Очень понравилась методология — так как ключевых слов в поисковых запросах про туризм оказалось очень много, исследователи решили взять те запросы, в выдачу на которые попадают популярные туристические сайты.

https://yandex.ru/company/researches/2019/tourism
1
Вечер пятницы – самое время посмотреть на какой-нибудь лёгкий для восприятия и красивый дата-проект.

Explore Adventure на данных поисковых запросов Google рассказывает, какие районы, культурные и природные объекты становятся популярными у туристов разных стран.

Это не готовая история – тут надо будет кликать и изучать датасет самостоятельно. Зато очень симпатично и адаптивно.

https://explore-adventure.com
Хотите превратить свои данные во что-то осязаемое?

DataJournalism.com рассказывает про явление «data physicalisation» – это когда данные можно представить в виде, в котором их можно услышать, потрогать, ощутить на вкус.

В конце – гайд, как сделать такую же красоту как на фото.

https://datajournalism.com/read/longreads/lets-get-physical-how-to-represent-data-through-touch
(мне кажется, было бы безумно круто, если бы кто-то сделал такую выставку!)
Вот ещё пример очень милой data physicalisation. Это вязаное одеяло на фото имеет вовсе не случайный принт — отец вышивал узор, опираясь на данные о графике сна своего чада. Интересно, что в начале одеялка линии более хаотичны, а чем старше становится ребёнок, тем больше сон оформляется в определённое расписание.

Посмотреть, как это сделано и как это выглядит в расправленном виде, тут:
https://www.thisiscolossal.com/2019/07/baby-data-blanket
Завтра — 50 лет с тех пор, как на поверхность луны впервые вступила нога человека.

По этому поводу в СМИ выходит много классных спецпроектов, а мы предлагаем ознакомиться с материалом Bloomberg — он про космическую гонку США и Китая — с данными и графиками, как вы любите.

https://www.bloomberg.com/graphics/2019-us-vs-china-moon-race/

(если кончился лимит — режим инкогнито в помощь!)
Ещё один материал про космос, который я сначала недооценил с точки зрения работы с данными — о том, что делали Базз Олдрин и Нил Армстронг во время высадки на Луну.

Что интересно: история рассказана в виде реальных диалогов космонавтов, которые затем визуализированы в виде таймлайна (там учитывается частота и длина сообщений) — выглядит необычно, но не очень понятно — не хватает легенды и объяснений, что происходило в кульминационные моменты.

В это же время фигурки космонатов перемещаются по поверхности Луны — автор смотрел видео и карты, чтобы наиболее точно передать произошедшие события.

У себя в блоге автор рассказывает, как это всё было сделано — от идеи и первых концептов дизайна до поиска данных и выявления проблем.

https://infowetrust.com/tranquility-design/

Сам проект, кстати, лучше смотреть с ПК, но на телефонах тоже всё нормально работает.
Этот текст, конечно, не про «дату» в привычном нам смысле, хотя в качестве основного источника информации здесь используются открытые судебные решения, которые часто становились предметом для анализа в наших работах в «Новой газете».

Но я хочу им поделиться, потому что он мне он показался интересным – здесь о том, как бывшие любовники начинают мстить своим возлюбленным после расставания.

Думаю, если бы мы делали такую работу, то постарались бы некоторые тезисы проиллюстрировать, анализируя весь массив решений – например, о том, что девушки получают более мягкие наказания за подобные преступления (в тексте это показано на одном примере).

Но это совсем не обязательно, текст и без этого интересный и достаточно полно освещает проблему:

https://www.bbc.com/russian/features-48720689
Вот как раз свежая работа дата-отдела «Новой» про судебные решения — авторы материала нашли и проанализировали дела, где обвиняемых наказывали за «оскорбление власти» в интернете

https://www.novayagazeta.ru/articles/2019/07/20/81313-oskorbleny-i-ochen-opasny
Но самая серьёзная наша дата-работа по судебным решениям, конечно, была про дословно совпадающие дела. Она выходила в марте, и, возможно, вы её не видели.

Если коротко, мы доказали, что судьи часто копируют фрагменты одного судебного решения в другое — заменяя лишь имена, даты, места и другие исключительные подробности, которые никак не могут совпасть.
Правда, если верить таким судебным решениям, то окажется, что в преступления совершаются с феноменальными совпадениями — например, сотрудники силовых структур каждый раз «случайно» оказываются дома у наркоманов как раз в тот день, когда они решают сварить зелье и «кайфануть» с кондитерского (!) мака.

Из 780 тысяч судебных решений за 2017 и 2018 год, которые мы анализировали, 50 тысяч оказались на 80 и более процентов совпадающими хотя бы с одним из других.
К вопросу о том, почему это МОЖЕТ БЫТЬ плохо — вот вам пример:
195 из 234 страниц приговора по делу Ив Роше (обвинямые — братья Навальные) скопированы из обвинительного заключения. Вместе со всеми опечатками.

Приговор пишет судья, а обвинительное заключение — следователь. При таком раскладе невозможно понять, критически ли судья осмыслил позицию обвинения или принял её на веру, не вникая.

В 2016 году Верховный суд запретил списывать приговоры из обвинительных заключений, но вот приговоры с приговоров списывают до сих пор.