data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
941 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
NYT рассказывает про технологии китайской пропаганды, которые правительство практикует в социальных сетях.

Интересно, что в Китае Твиттер «заблокирован», и в первую очередь эта пропаганда направлена на остальной мир. А ещё — на Гонконг, где сейчас массовые протесты, а ограничений на соцсеть нет.

Технологии манипуляции, как пишут NYT, оказались дешёвыми и жалкими — своё мнение аккаунты выражали только в рабочее время, а до этого писали сообщения на другие темы и на других языках. Скорее всего, такой подход — попытка быстро отреагировать на вспыхнувшие гонконгские протесты.

https://www.nytimes.com/interactive/2019/09/18/world/asia/hk-twitter.html
В Яндексе проанализировали поисковые запросы и сделали инфографику по сериалу «Друзья».

Какие там моменты были популярны, кто с кем связан, и какие серии вызывали больше ажиотажа:

https://yandex.ru/company/researches/2019/friends
Это хорошо, надо смотреть 😄
Сегодня вышел материал дата-отдела «Новой» об избиениях и убийствах детей в российских семьях. Разобрали судебные решения по шести статьям Уголовного кодекса, доступные в ГАС «Правосудие».

Получилось, что 80% преступлений против детей в России совершаются именно в семье. Подсудимым смягчают наказания за наличие других, не пострадавших, детей или могут отпустить даже без штрафа, потому что стороны помирились (например, 5-летний ребенок простил родителя или вообще за него помирилась мать, потому что он еще не умеет разговаривать).

Но не буду писать тут все выводы исследования, лучше прочитайте сами
https://www.novayagazeta.ru/articles/2019/09/23/82057-ya-tebya-i-ubyu
Хочется обсудить с вами вот что.

Мы изначально придумали, что в материале будут иллюстрации талантливой художницы Наташи Ямщиковой. И получились они, на наш взгляд, действительно сильными и уместными.
Но вот над графиками пришлось поломать голову. Мы решили, что в этот раз нет необходимости их рисовать ко всем частям исследования. Оставили только две инфографики: детализации по смягчающим обстоятельствам и наказаниям для каждой изученной статьи УК.

Интересно, что вы думаете на этот счет. Были ли вы вам интересны те графики, которые сейчас есть в тексте? Добавили ли бы вы еще и каких? (пишите @iradolinina или @marohovskaya)
Свою версию этого графика предложил Александр Богачев.
Стало нагляднее, по каким статьям чаще получают реальный срок.
Punk is dead, уличным протестом нынче рулит хип-хоп. Так посчитали РБК, рассказав о музыке на крупных митингах последних лет.

С жанрами есть вопросы, потому что IC3PEAK, как по мне, странно относить к хип-хопу, да и iTunes (по методологии жанры брали оттуда) выдаёт разные варианты, но интересно все равно:

https://www.rbc.ru/society/27/09/2019/5d8b33b79a7947c837aefe6d
Не столько крутой проект The Pudding, столько идея, которую круто раскрыть и рассказать по-другому.

Они использовали Event Registry API, чтобы получить новости с большого количества СМИ и узнать, в каком контексте в новостях упоминаются миллениалы.

Выглядит это плохо, потому что не оформлено ну совсем, пользователю только предлагают поискать что-то в огромном облаке тегов, где нет никаких визуальных ориентиров, а наугад выбранное слово показало мне, что алгоритм всё-таки плохо справился с определением контекста:
millenials - want - personal data в реальности оказывается "Millennials want to share personal data — but not for free"

https://pudding.cool/2019/09/millennials/
Transparency вместе с DataStorytellers и Kompany сделали интерактивный проект про лоббизм в Госдуме

Можно узнать, интересы каких компаний, институтов и секторов бизнеса продвигает каждый депутат и насколько он влиятелен по сравнению с другими депутатами в своей группе.

Desktop first, но с телефона можно покликать тоже:
https://dumabingo.ru/
Классный проект, который вошёл в лонг-лист престижного конкурса по визуализации данных Information is Beautiful.

Это исследование о том, как часто упоминаются местоимения разного пола в СМИ (здесь исследовали Guardian). Удивительно, но даже тут есть дисбаланс — про мужчин пишут заметно чаще. Правда, в последние годы ситуация заметно меняется.

https://data-viz.nesta.org.uk/measuring-gender-imbalances-reporting-creative-industries/index.html
Там ещё есть интересная, хоть и не очень понятная инфографика о том, какие слова чаще употребляются с местоимениями обоих полов
The Bell выпустил материал о том, какие приложения передают и собирают больше всего информации о пользователях.

Среди 100 самых популярных бесплатных приложений в Google Play лишь 11 не отправляют данные сторонним компаниям, а самым «жадным» до разрешений оказался клиент ВКонтакте.

https://thebell.io/shpion-iz-smartfona-top-10-prilozhenij-sobirayushhih-vashi-dannye/
Очень красивый датавиз про движение поездов.

Лучше смотреть с компьютера:
https://tulpinteractive.com/on-time-every-time/
Тот случай, когда с инфографикой проблемы, но аналитика интересная: «Медиалогия» посчитала, какой информационный шум подняли суды последних месяцев.

Иван Голунов оказался в два раза популярнее Павла Устинова и в четыре раза – Егора Жукова.

Ещё заметно, что исход дела не всегда зависит от количества виртуальной «поддержки» – репрессивная машина применяет индивидуальный подход.

https://spark.ru/startup/spark-news/blog/51402/skolko-nado-informatsionnogo-shuma-chtobi-ne-popast-v-tyurmu
Вчера количество подписчиков здесь стало четырёхзначным, и мне хочется выступить с небольшим сообщением на этот счёт.

Этот канал появился как канал объявлений для хакатонов «Новой газеты» по дата-журналистике. После второго из них, который прошёл в конце апреля, здесь было примерно 150 человек, и мы подумали – раз уж здесь собралось такое количество интересующихся дата-журналистикой людей, им можно рассказывать что-нибудь интересное.

Идея оказалась замечательной, потому что первая тысяча набралась спустя пять месяцев после фактического запуска канала – при этом никто специально не занимался его продвижением.

В канале можно увидеть сообщения от трёх людей. Это корреспондентки дата-отдела «Новой» Алеся Мароховская и Ира Долинина и я. Я уже не имею отношения к дата-отделу, хотя с «Новой» мы по-прежнему дружим и сотрудничаем :)

Спасибо большое за то, что читаете и делитесь фидбеком. Приятно делать что-то, что находит отклик!

И ура! 🎉
Журналистика данных, которую мы заслужили (про задницы)

Интерес в том, что слово 'ass' в английском языке может употребляться в большом количестве значений, и Pudding рассказывают, в каких и как.

Мне вообще безумно нравится этот формат нарратива – видимо, идея исследования пришла из выступления комика, и они его пошагово показывают, чтобы рассказать историю

https://pudding.cool/2019/10/slang/