data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
941 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Написали о том, как руководители предприятий совершают «общественно опасные» (цитата) деяния — проводят через бухгалтерию штрафы, которые были наложены на них как на должностные лица.

Вот пример: инспектор по пожарной безопасности находит в больнице какие-нибудь неправильно установленные огнетушители, выписывает главврачу штраф 2000, тот даёт бухгалтеру распоряжение — этот штраф оплатить, и за это ему (главврачу) прилетает условный срок.

И всё бы хорошо, но с судимостью карьерные возможности резко сужаются. Помните же, что многие организации (в особенности — государственные) требуют справку об её отсутствии?

Судьи тоже осознают абсурд таких дел, и, кажется, не очень понимают, какое наказание выбрать — мы не выявили зависимости между общим размером штрафов, который осуждённые оплачивали «из кармана» организации и наказанием, которое они за это получили.

https://www.novayagazeta.ru/articles/2019/07/03/81119-melkie-prestupniki
1 июля 1997 года Гонконг перестал быть колонией Великобритании и стал специальным административным районом Китая с собственным законодательством.

В этот день каждый год проходят торжественные мероприятия, но и неизменно находятся люди, которые превращают праздничные шествия в столкновения и пытаются выразить протест.

На этот раз демонстрации окончательно смешались с мирными шествиями – это всё из-за законопроекта, который позволит властям Гонконга «выдавать» Китаю людей, которые нарушили законы КНР.

Масштабные митинги против этого закона проходили помимо 1 июля ещё трижды – 21 и 26 июня, а также 7 июля. Bloomberg в цифрах и картах рассказывает, чем отличались эти демонстрации:

https://www.bloomberg.com/graphics/2019-changing-tactics-of-hongkong-protests/
(как всегда – если кончился лимит – режим инкогнито вам в помощь)
Анализ данных может изменить мир!

Исследователи из The Truth Initiative посмотрели 350 часов популярных сериалов на Netflix и американском ТВ и выяснили, что герои картин курят всё чаще и чаще, причём более 2/3 сцен употребления табака приходятся на продукты Netflix.

Развлекательная компания уже обратила внимание на исследование и выступила с официальным заявлением — в новых сериалах герои будут дымить только если это действительно будет необходимо. Например, чтобы показать историческую действительность или подчеркнуть образ определённого персонажа.

https://www.truthinitiative.org/research-resources/tobacco-pop-culture/while-you-were-streaming-smoking-demand
Психоделичные карты в свежем исследовании Яндекса про туризм.

Кроме них там — рейтинг стран по туристическим запросам, рассказ о влиянии кризиса 2014 года на популярные у российских туристов направления, а также карта «схожести» туристических городов.

Очень понравилась методология — так как ключевых слов в поисковых запросах про туризм оказалось очень много, исследователи решили взять те запросы, в выдачу на которые попадают популярные туристические сайты.

https://yandex.ru/company/researches/2019/tourism
1
Вечер пятницы – самое время посмотреть на какой-нибудь лёгкий для восприятия и красивый дата-проект.

Explore Adventure на данных поисковых запросов Google рассказывает, какие районы, культурные и природные объекты становятся популярными у туристов разных стран.

Это не готовая история – тут надо будет кликать и изучать датасет самостоятельно. Зато очень симпатично и адаптивно.

https://explore-adventure.com
Хотите превратить свои данные во что-то осязаемое?

DataJournalism.com рассказывает про явление «data physicalisation» – это когда данные можно представить в виде, в котором их можно услышать, потрогать, ощутить на вкус.

В конце – гайд, как сделать такую же красоту как на фото.

https://datajournalism.com/read/longreads/lets-get-physical-how-to-represent-data-through-touch
(мне кажется, было бы безумно круто, если бы кто-то сделал такую выставку!)
Вот ещё пример очень милой data physicalisation. Это вязаное одеяло на фото имеет вовсе не случайный принт — отец вышивал узор, опираясь на данные о графике сна своего чада. Интересно, что в начале одеялка линии более хаотичны, а чем старше становится ребёнок, тем больше сон оформляется в определённое расписание.

Посмотреть, как это сделано и как это выглядит в расправленном виде, тут:
https://www.thisiscolossal.com/2019/07/baby-data-blanket
Завтра — 50 лет с тех пор, как на поверхность луны впервые вступила нога человека.

По этому поводу в СМИ выходит много классных спецпроектов, а мы предлагаем ознакомиться с материалом Bloomberg — он про космическую гонку США и Китая — с данными и графиками, как вы любите.

https://www.bloomberg.com/graphics/2019-us-vs-china-moon-race/

(если кончился лимит — режим инкогнито в помощь!)
Ещё один материал про космос, который я сначала недооценил с точки зрения работы с данными — о том, что делали Базз Олдрин и Нил Армстронг во время высадки на Луну.

Что интересно: история рассказана в виде реальных диалогов космонавтов, которые затем визуализированы в виде таймлайна (там учитывается частота и длина сообщений) — выглядит необычно, но не очень понятно — не хватает легенды и объяснений, что происходило в кульминационные моменты.

В это же время фигурки космонатов перемещаются по поверхности Луны — автор смотрел видео и карты, чтобы наиболее точно передать произошедшие события.

У себя в блоге автор рассказывает, как это всё было сделано — от идеи и первых концептов дизайна до поиска данных и выявления проблем.

https://infowetrust.com/tranquility-design/

Сам проект, кстати, лучше смотреть с ПК, но на телефонах тоже всё нормально работает.
Этот текст, конечно, не про «дату» в привычном нам смысле, хотя в качестве основного источника информации здесь используются открытые судебные решения, которые часто становились предметом для анализа в наших работах в «Новой газете».

Но я хочу им поделиться, потому что он мне он показался интересным – здесь о том, как бывшие любовники начинают мстить своим возлюбленным после расставания.

Думаю, если бы мы делали такую работу, то постарались бы некоторые тезисы проиллюстрировать, анализируя весь массив решений – например, о том, что девушки получают более мягкие наказания за подобные преступления (в тексте это показано на одном примере).

Но это совсем не обязательно, текст и без этого интересный и достаточно полно освещает проблему:

https://www.bbc.com/russian/features-48720689
Вот как раз свежая работа дата-отдела «Новой» про судебные решения — авторы материала нашли и проанализировали дела, где обвиняемых наказывали за «оскорбление власти» в интернете

https://www.novayagazeta.ru/articles/2019/07/20/81313-oskorbleny-i-ochen-opasny
Но самая серьёзная наша дата-работа по судебным решениям, конечно, была про дословно совпадающие дела. Она выходила в марте, и, возможно, вы её не видели.

Если коротко, мы доказали, что судьи часто копируют фрагменты одного судебного решения в другое — заменяя лишь имена, даты, места и другие исключительные подробности, которые никак не могут совпасть.
Правда, если верить таким судебным решениям, то окажется, что в преступления совершаются с феноменальными совпадениями — например, сотрудники силовых структур каждый раз «случайно» оказываются дома у наркоманов как раз в тот день, когда они решают сварить зелье и «кайфануть» с кондитерского (!) мака.

Из 780 тысяч судебных решений за 2017 и 2018 год, которые мы анализировали, 50 тысяч оказались на 80 и более процентов совпадающими хотя бы с одним из других.
К вопросу о том, почему это МОЖЕТ БЫТЬ плохо — вот вам пример:
195 из 234 страниц приговора по делу Ив Роше (обвинямые — братья Навальные) скопированы из обвинительного заключения. Вместе со всеми опечатками.

Приговор пишет судья, а обвинительное заключение — следователь. При таком раскладе невозможно понять, критически ли судья осмыслил позицию обвинения или принял её на веру, не вникая.

В 2016 году Верховный суд запретил списывать приговоры из обвинительных заключений, но вот приговоры с приговоров списывают до сих пор.
Интересно, что никакой общей команды «сверху» про копирование нет — даже если посмотреть на соседние районные суды, которые рассматривают примерно одинаковые преступления, можно обнаружить те, где копируют очень много и те, где копируют мало.

В общем, копировать или нет — это личный выбор каждого судьи.
The Pudding напомнили про ещё одну свою работу (помните, где было много-много красивых обложек?), связанную с книгами.

Эта очередная история про гендерный дисбаланс, хотя в данном случае речь вовсе не о дискриминации.

Авторы обнаружили, что в 90 годах на одну женщину – автора книги из рейтинга New York Times best sellers приходилось три мужчины.

Причина такого перекоса – это пик моды на «мужские» жанры в литературе.

https://pudding.cool/2017/06/best-sellers/
👍1
Россияне нервно смеются от слов «средняя зарплата», и не зря – почти три четверти населения таких денег не получают.

РБК изучили данные Росстата и рассказали, где разрыв между бедными и богатыми проявляется наиболее ярко:
https://www.rbc.ru/economics/20/07/2019/5d317d739a7947d7fa1672a3
National Geographic выпустила красивую графику о миграции за последние 50 лет.

Много картиночек и чуть-чуть текста о том, что за процессы происходили в странах, откуда и куда съезжались люди.

https://www.nationalgeographic.com/magazine/2019/08/graphic-shows-past-50-years-of-global-human-migration/
Автор визуализации делится у себя в твиттере первым прототипом (ничегонепонятно 🙈)
Но мой любимый проект про миграцию — этот:
https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study

Он рассказывает о том, как бездомные перемещаются между городами.
Если не видели его, посмотрите обязательно – там много крутой анимации
👍1