data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
938 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
The Pudding проанализировали 700 миллионов сообщений на Reddit, чтобы понять, как люди выражают смех в сети

Это история в трёх частях: во второй рассказывается эволюция выражения lol, а третья выйдет на следующей неделе.

Кажется, строго обязательно всем любителям мемов:
https://pudding.cool/2019/10/laugh/
Немножко о том, почему важна упаковка.

Сейчас по разным сайтам гуляет «свежая» новость: мол, Комсомолка публикует исследование о бедных и богатых районах Москвы

Вот этот текст, для москвичей статистика может быть занимательной:
https://www.kp.ru/daily/27049.4/4114895/
... но если немножко поискать, то окажется, что это пересказ колонки компании RRG, которая вышла на РБК 3 с половиной месяца (!) назад

Только на РБК вот такая страшная карта (у КП с ней тоже не всё в порядке, да), текст начинается с муторной методологии, а не интересных фактов, а ещё в нём полно слов, которые затрудняют восприятие.

РБК вроде бы не причём: текст-то не редакционный и вообще опубликован в экспертном разделе. Но вообще пример очень показательный: можно сделать сколь угодно классное исследование на данных, но его успех будет сильно зависеть от подачи

https://realty.rbc.ru/news/5d2f01999a79477926d8b0fe
«Твиттер нужен ему как нам еда»

Догадались, о ком речь? New York Times выпустили огромное исследование твиттера американского президента Дональда Трампа.

Там он в неконтролируемых количествах ругается, обвиняет всех подряд и распространяет фейки. Это, конечно, очень плохо сказывается на его репутации – об этом волнуются советники президента, но значительно повлиять не могут.

О чём график? Тут показано отношение американцев к разным темам и количество лайков на постах в твиттере. То, что американцев раздражает, собирает больше всего лайков.

В самом расследовании много частей, прокликать можно в верхней части сайта, а начало тут:
https://www.nytimes.com/interactive/2019/11/02/us/politics/trump-twitter-presidency.html
Вот такой рофл: Трамп разговаривает с российскими троллями
О: интересное явление. В конце 80-х самые популярные имена казахов были распространены и в России. Но чем дальше от развала Союза, тем реже мальчиков называют привычно для нас
Forwarded from FactCheck.kz (Внимательный читатель)
This media is not supported in your browser
VIEW IN TELEGRAM
Вновь, как и в с случае с нур-неймингом, хотим показать вам, что анализ статистики может быть весьма увлекательным. Как называли своих детей казахстанцы с 1988 по 2018 год. Больше данных - по ссылке https://factcheck.kz/socium/aleksandr-vs-aruzhan-istoriya-kazaxstana-v-imenax-novorozhdyonnyx/
Соавторы датасета: Аслан Сеит, Мяхрибан Сейтлиева, Зульфия Раисова, Мадина Булатова, Мавзуна Табарова
Прикольное исследование о цветах в произведениях русских классиков.
Возможно, кому-то на уроках литературы говорили, что Достоевский любит жёлтые цвета, а Тургеньев — синие. Ну вот — всё не совсем так. Человеку легко зацепиться за яркий образ, питон же таких пристрастий не имеет:

https://readymag.com/u94255285/colors-of-classics/

(*питон – это язык программирования Python)
Инсайт: на самом деле, все любят красное и чёрное
РБК на данных рассказывает, что происходит с врачами в России.

Если коротко:
— За 8 лет врачей в стране стало на 6% меньше.
— Врачей из скорой помощи в большом количестве перевели в больницы и поликлиники. но количество фельдшеских бригад увеличили.
— Специалистов сокращают: в поликлиниках становится меньше хирургов, терапевтов, педиатров... зато больше рентгенологов и врачей УЗИ
— В перспективных регионах количество сотрудников может увеличиваться, но вот с отстающими всё страшно. Вот про Чукотку, например: «Врачей многих популярных специальностей в регионе нет: там не работает ни одного гастроэнтеролога, психотерапевта, аллерголога, нефролога, ревматолога, а также нет ни одного судебно-психиатрического эксперта и ортодонта. В 2018 году уволились единственные бактериолог и врач лечебно-физической культуры (ЛФК), а также шесть из 38 терапевтов, два из 26 гинекологов и два стоматолога»

https://www.rbc.ru/society/08/11/2019/5dc2842f9a79472a93e695b1
Пару месяцев назад я писал тут про Data Physicalisation.

Это когда когда данные представляют в виде чего-то, что можно потрогать, услышать, попробовать на вкус.

Вот классный пример – линейка одежды, в которую «зашили» дата-арт.

За паттернами скрываются такие истории: алгоритм первого в мире программиста Ады Лавлейс, эксперименты первой чернокожей девушки в космосе Мей Джемисон и содержание книги популярной эко-защитницы, биолога и писательницы Рейчел Карсон.

Историю создания коллекции и легенду к инфографике можно найти тут:
https://www.stories.com/en_eur/giorgialupi.html
Strelka Mag выпустили интерактивную карту застройки Москвы — на ней можно найти свой дом и узнать, когда он был построен. И заодно — посмотреть, как строился ваш и соседние районы.

https://strelkamag.com/ru/article/moscow-housing-map
Водители Москвы – самые яростные — пишут Bloomberg.

Да — бывает и хуже, например, в Улан-Баторе. Более полный рейтинг:
https://www.bloomberg.com/news/articles/2019-11-13/think-road-rage-is-bad-in-your-city-try-driving-in-mongolia
Нежно люблю, когда политические темы раскрывают через какой-то фан, а особенно – творчество.

У The Economist вышел материал о том, как партийные предпочтения накладываются на музыкальные вкусы американцев.

Либералы слушают скорее хип-хоп, консерваторы – кантри.

Если бесплатно зарегистрироваться, то текст точно должны дать прочитать:
https://www.economist.com/graphic-detail/2019/11/16/why-obama-trump-swing-voters-like-heavy-metal
На DataFest в Тбилиси я познакомилась с двумя основательницами крутого грузинского проекта Tracking Violent Crimes against Women. Аналогичный, кстати, очень был бы полезен в России.

То, что они рассказали, легко укладывается и в нашу практику: данных о фемициде нет, поэтому их приходится собирать самим, что они и сделали. У них есть целая рабочая группа студентов, которая находит кейсы, разговаривает с семьями погибших, проводит факт-чек. Не просто добавляют имя и информацию в табличку с даннами, а рассказывают истории.

К сожалению, большая часть сайта доступна только на грузинском, но истории, карта и датасет есть и на английском. На карту нанесены все данные, их можно фильтровать по куче параметров.

https://femicide.ge/eng/cases/
Большие данные про большие волосы – так называется новый проект The Pudding.

Нетрудно догадаться, что это проект про причёски. Данные там, конечно, не большие – анализировали 30 тысяч фотографий из школьных фотоальбомов, чтобы понять, когда были в тренде разные причёски, и как у людей менялась медианная длина волос.

https://pudding.cool/2019/11/big-hair/
Сегодня в «Новой» и на «Медиазоне» вышло большое дата-исследование про домашнее насилие, которое начинали делать участники нашего хакатона.

Команды исследовали вопрос через судебные решения и нашли страшное:
– 79% женщин убивают из необходимости самообороны – их дела связаны с насилием со стороны партнёра;
– близкие мужчины для женщин опаснее, чем посторонние: 83% женщин, по мнению суда превысивших пределы самообороны, защищались от мужа/парня/любовника и только 5% – от незнакомца.
– с мужчинами всё предсказуемо наоборот: от партнёрш они почти не защищаются, чаще всего обороняться приходится от знакомых

Больше статистики и информации тут:
https://zona.media/article/2019/11/24/women-105

или тут:
https://novayagazeta.ru/articles/2019/11/25/82847-ya-tebya-seychas-suka-ubivat-budu
Вот ещё интересный момент, связанный с превышением пределов самообороны:

Женщины защищаются ножом от мужчин, которые нападают на них голыми руками, у мужчин же в большинстве случаев битва именно нож-на-нож

И да – на этом графике нет пометок, кто нападает, но это в подавляющем большинстве мужчины, за ничтожными исключениями.
Ну милый материал вышел у Т — Ж: они собрали разную статистику, чтобы составить портрет типичной россиянки.

Узнаёте в нём какую-нибудь свою тётушку из регионов?

https://journal.tinkoff.ru/citizen-2019/