data.csv
13.1K subscribers
1.25K photos
77 videos
6 files
938 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Как вы догадались, я сегодня слежу за DataFest, а заодно и рассказываю вам о работах, которые привлекли моё внимание, но я о них ещё не писал тут.

Габриэль Мерит говорит, что она часто слышала от друзей и знакомых фразы вроде [да не воспринимаю я эти ваши графики], [это скучно].

Поэтому она пришла к мысли, что визуализация данных не обязательно должна быть похожа на график.

Интересная фишка Габриэль — умелое использование фотографий, благодаря чему работы становятся более «живыми»

Больше вдохновения:
https://www.instagram.com/gab.md/
👍1
У нас в «Мастерской» вышел новый урок — очистка данных и фишинг с помощью OpenRefine.

Это очень удобный инструмент для очистки. Я сама им предпочитаю пользоваться вместо Python, когда данных не прям много, а нужно что-то быстро почистить и привести к единому виду.

Вот вам занятие для воскресного вечера: https://www.youtube.com/watch?v=Z4v9cwNUohk

Текстовая версия урока: https://www.istories.media/workshops/2020/05/23/openrefine-/
Новый выпуск рубрики «Статистика» на Т—Ж рассказывает о смертях в России. Наша страна по уровню смертности обгоняет всю остальную G20 и почти всю Африку за исключением Лесото.

В Лесото, кстати, четверть населения болеет СПИДом.

О том, от чего умирают россияне по версии официальной статистики, и где больше всего похоронных контор (совсем недавно лидером была не Москва!), читайте в материале:
https://journal.tinkoff.ru/mortality-stat/
Данные неожиданно появились в ролике у блогера Руслана Усачева

Он нашёл чек, по которому закупался на вечеринку 13 лет назад, и повторил опыт в наши дни.

Оказалось, что аналогичная корзина стоит на 257% дороже, хотя по официальным данным инфляция за эти годы составила 156%. Да — её нельзя считать исключительно по продуктовому набору, однако такая разница все равно кажется пугающей.

Тут — само видео с подробностями, а тут — табличка с расчтётами.
Ещё один пример, как симпатично можно соединить данные и фотографию:

Проект Happy Data — это такой антипод бесконечным и утомляющим графикам про коронавирус. Классные новости на фоне красивых видов из окна — вы даже можете отправить свой, и, возможно, из него сделают такую же инфографику.

Интересно, что один из авторов проекта — Джорджия Люпи, которая вместе со Стефани Позавеч придумала Dear Data.

Надо сказать, что проект, в первую очередь, про красивые картинки — информацию местами воспринимать слишком сложно, а некоторые изображения выглядят сомнительно с точки зрения принципов визуализации данных.
День социалочки про детей. В «Новой» вышло исследование про алименты. Оказывается, россияне платить их не привыкли, а закон против них бессилен — 94% долгов с 2014 года — безнадёжные.

А если деньги на ребёнка и выплачивают, то во многих случаях — ничтожные:

Отец-одиночка Владимир из Смоленска развелся с женой 1,5 года назад — они подали встречные иски об алиментах и определении места жительства их 8-летнего сына. Мама ребенка от своих требований отказалась и в скором времени вышла замуж снова. Алименты с ее стороны по решению суда составили 2900 рублей. «Эта сумма ничтожная. Ее устроили на работу на минималку, ¼ дохода. Я думаю, что это фиктивные цифры. Деньги поступают регулярно, но если даже я их потеряю, то не расстроюсь», — отмечает Владимир.

https://novayagazeta.ru/articles/2020/06/01/85644-alimenty-data
Яндекс выпустил карточки с исследованиями про музыку в изоляции

Все помешались на вирусе и всё-таки стали чаще тренироваться, судя по плейлистам:
https://yandex.ru/company/researches/2020/music-in-isolation
Остроумно-забавное исследование Любови Поповец и её проекта @callmedata про еду в произведениях русских классиков.

Внутри — ответы на вопросы:
— Что больше любит Тургеньев — вино или чай?
— Предпочитали ли русские писатели рыбу мясу
— ... и как они могли бы назвать свои кафе, если бы занялись бизнесом

https://lyubov9995.wixsite.com/classicfood
Вчера кончилась чудесная конференция по дата-журналистике LAMPA, и у меня только появилось время, чтобы черкнуть пару строчек.

Больше всего меня впечатлило выступление Ярины Серкез — дата-журналистки, которая работала в The Washigton Post и сейчас работает в New York Times. Я очень удивился, когда узнал, что стрим будет на русском языке, а сама Ярина родом из Украины. Запишу тезисно несколько интересных моментов, о которых она говорила на стриме:

О начале пути
— Ярина стажировалась у Washington Post в США, но через какое-то время после окончания стажировки ей пришлось вернуться на родину.
— Удалённая работа — нестандартная практика для Washington Post, однако журналистке удалось уговорить редакторов взять её на контракт.
— Ярина считает, что получить стажировку ей удалось благодаря хорошему портфолио. До этого она работала в издании texty.org.ua. Это украинское медиа, которое специализируется на журналистике данных.

О культурных моментах и западных стандартах
— Сейчас Ярина живёт в Германии, а в NYT пока тоже работает удалённо.
— Быть в теме американской повестки достаточно непросто, но в этом Ярине сильно помогают разговоры американскими друзьями, которые остались у неё после учёбы в университете.
— На Западе журналисты, которые работают с данными, обычно называются Graphics editor'ами.
— Если в странах СНГ ещё ведутся разговоры о том, должен ли дата-журналист программировать, то Ярина под работой с данными подразумевает, что человек знает Python или R. Второй базовый навык — это понимание визуализации данных и умение правильно её применять.

О тонкостях работы
— И в NYT, и WP большой штат людей, которые занимаются визуальной журналистикой (40+ человек), и кроме специалистов, которые умеют делать всё понемногу, в таких командах есть люди, которые специализируются на каких-то узких областях: статистике, 3D-моделировании, картографии.
— Компании обычно охотно делятся своими данными, потому что это для них бесплатный пиар. С этим нет проблем, когда ты — NYT или WP.
— В последние месяцы на сайте New York Times не читали ничего, кроме новостей о коронавирусе. Если это не проект про вирус, это — "dead project".

Полную запись разговора можно найти здесь:
https://www.facebook.com/schoolofdataKG/videos/696150187785849/

И спасибо организаторам, вы сделали очень крутое мероприятие
Мы вместе с «Холодом» выпустили масштабное исследование о том, как россиян штрафовали и за то, и за это (но в основном за нарушение самоизоляции и посты в интернете)

Суды уже успели рассмотреть две трети (256 тысяч) протоколов за нарушение самоизоляции. В 88% случаев они признали граждан виновными.

И надо признать, что некоторые судьи работают на реактивном топливе: они херачат постановления сотнями в день. Один господин так разогнался, что рассмотрел за полчаса 111 дел, то есть 16 СЕКУНД НА ДЕЛО. Кажется, ни о каком адекватном рассмотрении дел снова нет и речи. Кстати, если присмотреться к графику, то можно увидеть, как Ленар Хасимов показывает фак российкому правосудию.

Читайте: https://bit.ly/3cY5953
Инстаграм поощряет «откровенные» фото

Расследование «Разденься или потерпи неудачу» выявило, что социальная сеть модифицирует ленты пользователей таким образом, что люди с минимальным количеством одежды чаще попадают в топ — и на это почти не влияет, с какими фотографиями пользователь взаимодействовал ранее.

Интересно, что успехом пользуются не только девушки в купальниках, но и мужчины с голым торсом.

Фейсбук всё опровергает, но вы можете почитать методологию и убедиться сами:
https://algorithmwatch.org/en/story/instagram-algorithm-nudity/
Коронавирус, кажется, заставил содрогнуться почти все сферы экономики. Наркоторговля — не исключение. «Нож», DrugStat и Андрей Каганских изучили российский коронавирусный наркорынок.

За апрель количество кладов сократилось на 13%, а продажи упали на 25%.

Из-за кризиса в России люди начали активнее искать работу в наркобизнесе.

Средний рост цен на основные наркотики в российской «потребительской корзине» составил 7%.

https://pandemic-research.github.io/
На этом видео из ТикТока Мона Чалаби демонстрирует как-то особенно популярный в последнее время приём, который называется сонификация.

Сонификация — это изображение данных в виде звука. Так, при помощи длительности разных нот Мона показывает, как менялось в Америке отношение к чернокожим.

https://www.tiktok.com/@mona_chalabi/video/6840096375984672006
Если вас заинтересовала эта тема, посмотрите видео от The Guardian про глобальное потепление — здесь уже более интересная музыка и симпатичная визуализация.

https://www.youtube.com/watch?v=9t7rswV0HTY
Вадим Шмыгов собрал наглядную картинку о том, как разные страны собирались к России на парад.

Интерактивная версия:
https://public.tableau.com/profile/tut.by/#!/vizhome/MoscowParade/sheet0