data.csv
13.1K subscribers
1.25K photos
77 videos
6 files
938 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
The Pudding с помощью бигдаты (4 миллиона ответов на опросы) и рисованных человечков показывают, как на дискотеках объединить или разделить людей разных поколений.

Это продолжение большого проекта про то, как люди узнают музыку:
https://pudding.cool/2020/09/wedding-playlists/
Если вы работаете с открытыми данными, то наверняка знаете про карты данных от Инфокультуры — карточки, которые помогают найти данные по разным-разным темам.

В этом году организация обновляет эти карты и просит сообщество помочь советом.

Расскажите, источники каких данных стоит включить в новые карты:
https://bit.ly/datamaps-ru
Оригинальная работа немецкого издания Morgenpost: вам предлагают разрезать Германию на две части и сравнить, как эти части отличаются по разным показателям.

Продолжительность жизни, папы в декрете, потребление мяса, использование велосипедов...
Германия — такая страна, где всё это интересно сравнивать, потому что она разная, и многие показатели действительно меняются географически.

https://interaktiv.morgenpost.de/deutschland-teilen-deutsche-einheit-wiedervereinigung/

P.S. Включайте гугл-переводчик
Яндекс провёл исследование о том, кто оказывает услуги на Яндекс.Услугах и какими словами хвалят этих людей.

Если тоже хотите «чутко с любовью», то обращайтесь к женщинам постарше. Мужчины в возрасте сделают «от бога», «без суеты» и «надёжно». Зато более молодые исполнители — «позитивно», «модно» и «талантливо».

https://yandex.ru/company/researches/2020/services
Ну очень красивая работа про цвета комиксов. На самом деле, можно заметить, что многие из них сделаны примерно в одинаковой цветовой палитре, однако соотношение основных цветов у них всё-таки меняется.

https://moebius.colortheft.com/
Сразу вспомнил другой похожий проект, где на цвета раскладывали кадры из фильмов. И вот фильмы — напротив, как правило, сильно друг от друга отличаются.

https://thecolorsofmotion.com/
Предвыборный скроллителл от Клооп (Кыргызстан). Там на носу выборы, поэтому журналисты посмотрели, как ведет себя оппозиция в парламенте.

Да в общем-то мнение оппозиции ничем не отличалось от мнения коалиции. Парламент чаще всего единодушен по любым вопросам. Даже когда речь идет о чувствительных законах, которые называют антинародными.

Материал помогает избирателям детально изучить партии и понять, за кого голосовать не стоит.

https://kloop.kg/t/deputies-kyrgyzstan/
Модные карты теперь можно сделать в два клика. Datawrapper выпустил шаблон spike maps.

Преимущество таких карт перед обычными symbol maps с кружочками разной площади заключается в том, что в местах скопления значений столбики, в отличие от кружочков, не перекрывают друг друга:
https://blog.datawrapper.de/spikemaps/
Снова потрясающая инфографика у Медиазоны. Журналисты получили закрытый архив материалов СК Беларуси о протестующих в Минске, проанализировали и визуализировали травмы потерпевших.

Почти половина пострадавших из этого списка были покалечены не на митингах, а уже после задержания.

https://mediazona.by/article/2020/10/13/minsk-beaten
FT собрали в большой визуальный спецпроект самые интересные факты про COVID-19 — рассказывают, как вспышки эпидемии возникали в разных странах, чем отличались их пути, в чём проблема подсчётов смертности и как болезнь развила политический кризис в США.

В целом, ничего нового — скорее такой красивый справочник, по которому лет через 10 можно будет рассказывать детям, в каком ужасе мы жили в 2020 году.

https://ig.ft.com/coronavirus-global-data/
Спустя полтора года всё-таки вышел второй выпуск интерактивного журнала Parametric Press. Глобальная тема этого выпуска — климатические изменения.

Здесь есть:
— статья о выбросах углекислого газа, которая адаптируется под возраст читателя. Там ещё прикольная визуализация, которая показывает, как выглядит разная концентрация частиц.
— скроллителлинг и трёхмерная инфографика про корпорации, которые больше всего загрязняют атмосферу. Топ-20 из них, оказывается, делают треть всех выбросов, а наш Газпром входит в десятку крупнейших.
— материал про роль водорослей и деревьев в спасении нашей планеты, в котором есть красивая симуляция — можно сажать деревья и смотреть, как они очищают воздух
— лонгрид о засухах, в котором можно порассматривать спутниковые снимки
— и ещё одна статья про выбросы углекислого газа, которая объясняет, как современная инфраструктура меняет мир, и сколько CO2 производится во время просмотра веб-сайтов. Примечательна обилием анимированных экспленеров.

Что особенно круто и ценно, исходный код все материалов в журнале доступен на гитхабе. А вообще — очень хорошая дата-журналистская работа — есть, на чем подумать, на что залипнуть, и какие приёмы утащить себе на будущее.
Простенький калькулятор — сколько бы вы могли питаться на стоимость айфона.

Для меня цены завысил, хотя, наверное, это потому что я не закупаюсь в «Азбуке вкуса». Такая антиреклама магазину получилась.

https://www.sravni.ru/promo/azbuka-vkusa/
This media is not supported in your browser
VIEW IN TELEGRAM
В сервисе для визуализации данных Flourish появился новый красивый шаблон — стримграф. Стримграфы позволяют симпатично визуализировать изменение разных величин во времени.

https://flourish.studio/2020/10/19/streamgraphs/
Алгоритмы интернет-гигантов используют гендерные степеотипы при выборе аудитории для таргетированной рекламы. К такому выводу пришли исследователи из AlgorithmWatch, запустив в Facebook и Google объявления о найме, не настраивая в таргете ничего, кроме локации.

В итоге объявление с вакансией водителя грузовика показали 4864 мужчинам и 386 женщинам. А объявление с вакансией няни — 6456 женщинам и 258 мужчинам

Опыт повторили с разными изображениями и выяснили, что изображение ноготочков будет чаще вылазить у женщин, а дорога с грузовиком — у мужчин.

Исследователи называют это явление дискриминацией, но я отношусь к этому скептически — всё-таки гендерные стереотипы имеют прямое отношение к реальной жизни, и пользователи разного пола охотнее будут кликать на разные объявления, а Google с Facebook просто оптимизируют таргет так, чтобы принести владельцу рекламы больше кликов.
Подозреваю, что алгоритм может учиться прямо «на ходу» — если он видит, что на объявление кликает много женщин, а мужчины его игнорируют, то дальше он будет показывать рекламу только женщинам.

С другой стороны, наверное, нехорошо, что платформы что-то решают за пользователя, если он сам того не хочет.

Впрочем, смотрите сами, думайте сами:
https://algorithmwatch.org/en/story/automated-discrimination-facebook-google/
Интересный текст на Хабре о том, как деградирует современная музыка.

Хиты наших дней менее богаты тембрально, тексты становятся более примитивными, а партии ударных построены на одних и тех же битах.

Заходная картинка там с Элджеем и Моргенштерном, но не ведитесь — вообще-то автор смотрел на иностранные исследования, героями которых стали англопоющие поп-звёзды:
https://habr.com/ru/post/524422/
Кофе в России сейчас очень популярен. Его продажи за последние 10 лет выросли вдвое, а по итогам 2019 года по популярности этот напиток впервые обогнал чай.

Собрали на Т—Ж статистику про кофе:
https://journal.tinkoff.ru/coffee-stat/
Тот момент, когда красивая инфографика оставляет смешанные чувства.

Эта работа должна рассказывать о городах-участниках программы мобильности между Европой и Африкой. На первый взгляд, сделано круто, но способ визуализации выбран крайне неудачный.
На этой картинке, например, кажется, что мигрантов не 25 процентов, а все 90, и их значительно больше, чем граждан.

У каждого города почему-то разные показатели, и для каждого показателя линия может кодировать совсем разные единицы. 1% населения — в случае с мигрантами, 3% — в случае со студентами.

А вы что думаете?

https://mayorsdialoguedataviz.odi.org/