data.csv
13.2K subscribers
1.25K photos
78 videos
6 files
943 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Советуем заглянуть к нашим друзьям на канал @gijnRu. GIJN — это глобальная сеть журналистов-расследователей, в которую входит 177 организаций-членов в 76 странах. Они регулярно пишут про полезные инструменты, освещают самые интересные расследования и беседуют с опытными авторами из этой сферы.
This media is not supported in your browser
VIEW IN TELEGRAM
Приложение Excel для iOS в обновлении получило функцию распознавания таблиц с фотографий (владельцы Android-смартфонов могли делать такое ещё в марте). В дата-тусовке даже пошли шутки, что теперь можно будет спокойно анализировать отчёты наших чиновников.

Однако стоит помнить, что эта технология не нова: например, у Abbyy есть мощный FineReader, который уже давно умеет делать то же самое. Только вот работают все такие алгоритмы не слишком хорошо: весьма вероятно, что при распознавании спутаются 0 и 9 или 7 с буквой T. В итоге всё придётся проверять вручную, что при большом количестве данных — утомительный труд.
Мы немного притихали, поскольку почти все новые дата-работы посвящены выборам в европейский парламент, что для россиян, кажется, не слишком интересно?

Но новая инфографика The Economist стоит, чтобы её изучить, даже если политическая ситуация в соседних странах вас не очень волнует. О чём тут речь: авторы утверждают, что партии, которые в какой-то степени выступают против Европейского союза, как правило либо ультраконсервативные, либо явно левые. Те же, что ЕС скорее поддерживают, по идеологии находятся ближе к центру.

https://www.economist.com/graphic-detail/2019/06/01/centrist-liberals-gained-the-most-power-in-the-eu-parliament

(Текст материала будет доступен, если зарегистрироваться)
Безумной красоты карты от Washington Post — о том, какие части Америки чаще всего подвергались природным катаклизмам.

https://www.washingtonpost.com/graphics/2019/national/mapping-disasters/
Одно из недавних громких событий в Америке – возможный запрет абортов в штате Алабама. NY Times в своём новом материале показывает, что запреты – не единственная проблема. Клиники, предоставляющие такие услуги, закрываются одна за другой, и за абортами приходится ехать далеко от дома.

https://www.nytimes.com/interactive/2019/05/31/us/abortion-clinics-map.html
Если вы любите пиво и пока не решили, куда поехать в отпуск – посмотрите материал Bloomberg. Они разбираются, почему средние цены на этот напиток в разных странах Европы могут отличаться больше, чем в три раза.

https://www.bloomberg.com/opinion/articles/2019-05-19/ab-inbev-beer-pricing-fine-exposes-problem-with-eu-market
Студия Инфографики РИА к юбилею Пушкина сделала спецпроект с необычным поворотом — про деньги.

Получилась занятная история о том, как поэт пытался сделать писательство прибыльным и зарабатывал себе на жизнь.

https://ria.ru/20190606/1555277842.html
Если бы Пушкин узнал, сколько в 2014 году собрала экранизация Дубровского...

https://www.kinopoisk.ru/film/677731/
Вчера в Москве задержали корреспондента отдела расследований «Медузы» Ивана Голунова, который был на нашем последнем хакатоне одним из менторов. У него якобы обнаружили два свертка с наркотиками. То, что эти свертки были ему подброшены, не вызывает никаких сомнений. Мы знаем Ивана не только как одного из лучших в России журналистов-расследователей с безупречной репутацией, но и как очень порядочного человека.

«Медуза» говорит, что Ивану уже поступали угрозы из-за готовящегося к публикации расследования:

«Более того, у нас есть основания полагать, что Голунова преследуют из-за его журналистской деятельности. Мы знаем, что в последние месяцы Ване поступали угрозы; знаем, в связи с каким готовящимся текстом; догадываемся от кого. „Медуза“ будет изучать каждое действие следователей по делу Голунова. Мы выясним, по чьей воле преследуют Ваню — и сделаем эту информацию публичной. Мы будем защищать своего журналиста всеми доступными способами».

Мы выражаем свою поддержку Ивану и его близким, очень надеемся, что весь этот ад схлопнется и Голунова отпустят, хоть такой сценарий в наших реалиях кажется немного утопичным.
Следить за событиями можно здесь — https://zona.media/chronicle/meduza — «Медиазона» ведет онлайн.

Расскажем сегодня вам о некоторых работах Ивана Голунова.
Если хотите больше понимать про то, как устроена коррупция в мэрии Москвы, читайте тексты Голунова.

Это прошлогоднее расследование Ивана про вице-мэра Москвы Петра Бирюкова. Голунов обнаруржил, что 9 из 10 квартир элитного жилого комплекса «Легенда Цветного» выкупила семья чиновника. Рыночная стоимость этого добра — 1,6 миллиарда рублей. Но это далеко не все, у Бирюковых есть огромное имение под Москвой с особняками, гостевыми домами и конюшней.

Как семья чиновника могла заработать такую сумму? Голунов проанализировал данные госзакупок, и оказалось, что бизнес родственников Бирюкова всегда был связан с его работой вице-мэра: компании его семьи получали миллиардные господряды от мэрии Москвы. Классика.

https://meduza.io/feature/2018/12/28/penthaus-razmerom-s-dva-eliseevskih
На нашем хакатоне Иван со своей командой работал над одной из самых острых и важных тем сегодня в России: мусор. Тему команды называли иронично «Мусорные данные», потому что, чем дольше ребята анализировали доступный материал, тем больше понимали, что мусора в этих официальных данных (ошибок, несостыковок, откровенных глупостей) не меньше, чем на свалках в России. Но вот такие сложности Голунова точно никогда не пугали, и я лично очень этим восхищаюсь. Не многие способны не только не бросить тему, на которую надо потратить кучу времени, по крупицам дотошно собирая информацию, но и в итоге докопаться до самого главного.

А вот расследование Ивана, для которого он разобрался, куда московские власти решили свозить миллионы тонн столичного мусора и кто будет этим заниматься: https://meduza.io/feature/2018/11/01/moskve-nado-izbavitsya-ot-shesti-millionov-tonn-musora-v-kakie-regiony-ego-budut-svozit-i-kto-etim-zaymetsya
Это исследование двухгодичной давности, но наверное как никогда актуальное.

Ивану Голунову грозит от 10 до 20 лет лишения свободы. При обыске у него нашли мефедрон и кокаин в объеме достаточном для уголовного дела. Никто из его коллег и близких не сомневается, что наркотики Ивану подбросили. И в таких делах у полиции набита рука. В 2017 году Институт проблем правоприменения выпустил доклад подтверждающий это.

«Больше всего преступлений МВД регистрирует с «массами, ненамного превышающими и значительный, и крупный размер». Это уже прямо доказывает, что в 2013–2014 годах по зафиксированным случаям оборота героина «имелись манипуляции массой изымаемого наркотика со стороны сотрудников МВД», убежден автор исследования».

Другими словами, необходимый объем подбрасывали людям для отчетности.

А вот пример с марихуаной. Пик числа изъятий наркотиков внезапно приходится как раз на минимальную дозу, за которую человека можно посадить — 6 граммов.

https://www.rbc.ru/society/28/09/2017/59ccbc489a79473ad83cd991
Мэтт Дэниэлс из The Pudding написал текст о том, как они делают карты.

Для этого в издании используют сервис Mapbox, и Мэтт целый год изучал, как лучше его интегрировать в работу редакции.

Если коротко, Mapbox хвалят за хорошую адаптивность, оптимизацию трафика, корректную работу при приближении и возможность как делать карты без знания программирования, так и улучшать их, используя код.

https://blog.mapbox.com/how-the-pudding-team-uses-mapbox-4b5b8577001f
This media is not supported in your browser
VIEW IN TELEGRAM
Бывший креативный директор Студии Инфографики РИА Денис Запорожан поделился небольшим видео на тему осуждённых.

Без инсайтов, но красиво.
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё одно видео из этой серии, но уже про ВИЧ
Приятный новый проект ТАСС про донорство. Внутри — много интересной инфографики: нашлось место даже для плиточной карты со small muptiplies и санкея (это диаграмма, которая используется для того, чтобы показать переход чего-то из одной группы в другую).

https://donor-krovi.tass.ru/
Журналистка из РБК Дада Линделл победила в конкурсе Data Journalism Awards в номинации «Лучший молодой дата-журналист года». Поздравляем коллегу! Это первая победа в конкурсе среди наших соотечественников.

Тут (https://www.rbc.ru/rbcfreenews/5d024eeb9a79473f90310a49) можно посмотреть видео журналистки для конкурса, а здесь (https://datajournalismawards.org/projects/dada-lyndell-young-data-journalist-of-the-year-portfolio-entry/) — работы победительницы

Не забывайте, что в России сайт Data Journalism Awards работает только через VPN.
1
В России мало СМИ используют данные в своих публикациях, и когда появляется кто-нибудь новый – это всегда интересно.

Вот – своё медиа запустил Центральный банк. Там уже можно почитать материал о том, как в России и в мире делят людей по группам дохода, и почему хоть и медианная и среднедоходная группа растут, россияне все равно недовольны. Текст понятен даже далёким от финансов людям (хотя первый график в тексте я очень долго рассматривал, прежде чем понять, что там изображено).

https://econs.online/articles/opinions/gde-prokhodyat-granitsy-blagopoluchiya/
А вообще банковское медиа – это очень логичное место для дата-материалов. Т-Ж вот тоже часто выпускает такие.

Сегодня, например, у них вышла история про то, как мошенники воруют деньги с карт.

https://journal.tinkoff.ru/card-fraud/
Нью-Йорк обрастает новыми высотками, и легендарная башня Empire State Building, которая ещё несколько лет назад была самым высоким зданием города, к 2024 году рискует даже выйти из десятки лидеров по этому показателю.

Новый проект New York Times – об экстремально высоких зданиях – как их строят, сколько на них тратят денег, и какие с этим возникают проблемы.

https://www.nytimes.com/interactive/2019/06/14/nyregion/new-york-skyline-inequality.html
Вы когда-нибудь читали пользовательские соглашения до конца? Они чаще всего ужасны, и NY Times даже посчитали, насколько: на примере privacy policy. Это документы, в которых описано, как компании используют данные пользователей.

Для измерения сложности текста использовали метрику Lexile, и по ней ученик колледжа должен уметь воспринимать тексты со сложностью в 1300 баллов, профессиональные врачи и юристы – 1440 баллов, а школьники после девятого класса должны освоить текст в 1050 баллов.

Между тем, privacy policy Airbnb по этой метрике набирает больше 1500 баллов, и это не предел...

Подробнее:
https://www.nytimes.com/interactive/2019/06/12/opinion/facebook-google-privacy-policies.html