data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
939 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
У «Важных историй» вместе с аналитиками из Vertical 52 и журналистами немецкого издания Tagesspiegel вышло красивое, но страшное, исследование масштабов разрушения украинских городов — Мариуполя, Северодонецка и Бахмута.

Оценить это удалось с помощью спутниковых снимков и модели на основе машинного обучения, которую впервые применили для документирования разрушений в секторе Газа.

К сожалению, из-за некоторых особенностей повреждений зданий и разрешения снимков, тут нельзя говорить об абсолютной точности, но последствия военных действий показаны очень наглядно.

https://storage.googleapis.com/istories/stories/2024/02/22/sledi-voini-iz-kosmosa/index.html
😢5218💔8😴3👍2🍌1
Сделали с коллегами большой проект про изменение климата в России

Долгое время я и сам смотрел на такие статьи у ведущих иностранных медиа и не мог взять в толк — почему все так носятся с этим потеплением на 2°C? Оказалось, что всего несколько градусов разницы не только могут вызывать катаклизмы по всему миру в будущем, но и уже оказывают видимое влияние на нашу страну в масштабе десятилетий.

К примеру, с середины прошлого века в Ростове-на-Дону число дней с температурой ниже нуля сократилось почти в два раза: в 1950-х годах их доля составляла 25%, в 2020-х — 13%.

Аномально холодных дней — таких, для которых температура ниже, чем на 5°C, чем в 1950-1979 годах*, во всех миллионерах в 1950-х было столько же, сколько аномально жарких. А сейчас их ~ в 5 раз меньше! Это значит, что особо холодные дни в любое время года (например, 5°C в июне или -30°C в январе) всё ещё могут наступить, но вероятность этого сильно ниже, чем раньше.

А ещё я в шоке от того, сколько проблем возникает при работе с климатическими данными. И посылаю восхищение командам Bloomberg, FT, NYT и другим, которые с ними работали — с виду казалось, что там всё должно быть очень просто 😄

Подробнее обо всём этом читайте в проекте:
https://yandex.ru/company/researches/2024/weather-change

*1950-1979 годы — это период, который мы во всём проекте использовали для сравнения. 30 лет — это стандарт у метеорологов, а 1950 выбран как точка, с которой у нас есть наиболее полные данные по России.
🔥7326👍15👏2😨2💊1
Пожалуй, одна из самых известных визуализаций современности — это Warming Stripes. Каждая полоска на этом графике показывает отклонение температур от конца XIX века. Она не даёт четкого представления о природе изменений, но зато быстро доносит сигнал — «становится теплее».

The New York Times рассказывают, что Эд Хокинс не случайно придумал эту идею — он вдохновился детским одеяльцем, которое сшила его коллега! Фактически, Warming Stripes впервые появились именно в физическом виде, а Эд лишь адаптировал визуализацию под цифровой формат.

В свою очередь, коллега Хокинса уже видела нечто подобное — оказывается, есть древняя традиция — делать одеяла (temperature blankets), на которых цветом показана температура разных дней. Ещё в статье упоминаются sky blankets — одеяла, раскрашенные в цвета неба, но мне не удалось найти хороших картинок, которые это юы иллюстрировали.

Почитать историю полностью и посмотреть на фото того самого одеяла:
https://www.nytimes.com/2022/06/17/climate/climate-warming-stripes.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
31🔥11👍5😱4❤‍🔥3😭2
Если вы делаете инфографику — есть шанс проявить себя

Школа Дизайна НИУ ВШЭ организует конкурс, на который можно подать любую свою работу, сделанную в период с января 2021 года.

Лучших — отметят, наградят и подарят приятные денежные призы.

В жюри — большое количество замечательных и уважаемых людей в сфере инфографики и визуализации данных, в том числе и ваш покорный слуга.

Работы можно подать здесь до 2 апреля:
https://hsedesign.ru/competition/87aeb9175ed941418f2ff96bfb263fcb

P.S. кнопка «участвовать в конкурсе» почему-то не работает, судя по всему — подавать придётся через кнопку «добавить проект».

Стоит найти на странице инструкции:
> Также мы подготовили гайд по работе с платформой, который поможет легко и быстро создать аккаунт и загрузить проект.
7🔥6👍1
Большой труд Тинькофф Журнала о работе дизайнеров, основанный на опросе читателей.

Внутри можно узнать:
* Дизайнеров какого возраста больше всего
* Как часто они переезжают, чтобы сменить работу
* Какое они получили образование
* Как их зарплата зависит от позиции, места жительства и сферы
* Трудятся ли дизайнеры в офисе или на удалёнке
* Что их беспокоит
* Многие ли ищут себе новую работу

... и многое другое

Кроме того, материал очень хорошо сделан инфографически, есть много классных приёмов и фишек, на которые стоит обратить внимание. При том, что это строгий материал, и может показаться, что тут некуда разгуляться, выглядит он очень симпатично:

https://journal.tinkoff.ru/zarplata-design-2024/
🔥279
Как понять, нужно ли вам делать дата-историю?

У издания The Pudding, славящегося самыми крутыми дата-историями, есть инструкция о том, как понять, можно ли и нужно ли делать историю, основанную на данных.

Если коротко, перед началом работы надо ответить на несколько вопросов:
* Есть ли у вас какой-то новый или уникальный вопрос, на который вы можете дать ответ?
* Можно ли дать ответ на этот вопрос при помощи данных?
* Можете ли вы достать данные, чтобы ответить на этот вопрос?
* Действительно ли результаты анализа получились интересными?

Для каждого этапа у The Pudding есть свои примеры, которые интересно поизучать:
https://pudding.cool/process/pivot-continue-down/
🔥21👍32🤔1
Иван Бегтин сегодня анонсировал новую платформу для поиска данных — Dateno.

Это сайт, на котором можно найти открытые данные и статистику со всего мира по поисковому запросу. На нём уже проиндексировано 10 миллионов датасетов (из них — 219 тысяч по России), а к концу года это количество планируют расширить до 30 миллионов. Можно указать тематику, язык источника, формат данных. А работает это уже лучше, чем тот же Google Dataset Search.

Портал пока находится в стадии беты, но уже работает:
https://dateno.io/
🔥92🆒7👀21👍1🍌1
Очень красивый материал Bloomberg о том, как война в Украине влияет на сбор урожая и его поставку в другие страны.

Несмотря на боевые действия, Украина по-прежнему является одним из крупнейших поставщиков пшеницы и кукурузы, но с каждым годом вести эту деятельность становится сложнее и сложнее. К примеру, из-за новой волны мобилизации в стране не хватает рабочих рук, чтобы собрать урожай. Также проблемой становится перевозка товаров — не всегда возможно сделать это безопасно.

Читать
🕊27😢9💔8😁1🤔1💘1
Есть что-то очень притягательное в этом графике, который называется тримап Вороного. Такое название он получил в честь математика, который придумал, как разбивать плоскость на множество элементов.

На этой картинке показано, как менялась капитализация 225 крупнейших японских компаний.

Что тут получилось хорошо:
• Показать, как изменилась доля компаний, входящих в общемировой топ-50
• Показать структуру экономики Японии
• Выделить ключевые компании в разные годы

Что получилось плохо:
• Дать понять, как изменилась структура японской экономики. Пайчарты, тримапы и диаграмма Вороного — это чаще всего плохие графики для сравнения значений.

Посмотрите на него и на другие графики в материале Bloomberg про взлёт японских активов:
https://www.bloomberg.com/graphics/2024-japan-nikkei-225-records-historic-high/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
19🤔5🔥4👍1
В сервис для визуализации данных Datawrapper завезли несколько новых фишек — историю версий и совместное редактирование графиков (прямо как в гугл-документах). Говорят, опции доступны во всех тарифных планах, даже в бесплатном.

А у вас когда-нибудь была необходимость совместного редактирования графиков?

https://blog.datawrapper.de/introducing-live-collaboration/
16👍3
Вместо тысячи слов скину скриншот из карты, которую делал в 2018 году для «Новой газеты»: можно было провести мышкой и открыть лицо кандидата, победившего в регионе (ну вы поняли, что там)

Карта уже «погибла» из-за переездов сайта, к сожалению — поэтому ссылки на интерактив не будет
🕊91😁31😢10🙈6🔥32
Независимые дата-журналисты уже делают первую аналитику результатов выборов по методу математика Сергея Шпилькина и приходят к ожидаемым результатам. Прошедшие «невыборы» стали рекордными по количеству фальсификаций: почти половина голосов за действующего президента могли быть ненастоящими.

Количество голосующих на выборах подчиняется нормальному распределению — основная часть избирателей проголосует на участках со средним значением явки. Например, если средняя явка составила 60%, то основная масса избирателей придёт на участки, где явка будет 50-70%. Участки, где явка будет 30% или 90% будут встречаться значительно реже.

Если распределение голосов не похоже на нормальное — это уже повод насторожиться. Если же при этом на участках с высокой явкой неестественным образом растёт число голосов «за партию власти», это явный признак вбросов.

Так и на этом графике: голоса за Слуцкого, Харитонова и Даванкова в сумме подчиняются нормальному распределению, а Путин неестественно растёт на участках с высокой явкой. Всё это мы уже не раз видели на выборах в России, а теперь встречаем фальсификации рекордных масштабов.
😢96👍22💊13🙈11🕊9😭5
Уже подъехало уточнение!

«Важные истории» пересчитали аномальные голоса с корректировкой: без результатов по Москве. В этом регионе результаты публиковались «в кучу». ЦИК объединил тех, кто голосовал на участках и электронно. Это искажало общую картину.

Поэтому более точная оценка по аномальных голосов за Путина по методу Сергея Шпилькина — почти 22 млн.

Но и у этого метода существуют ограничения. Реальная картина, скорее всего, куда более впечатляющая.

В канале опубликованы и другие интересные находки из данных. Например, как отразился «Полдень против Путина» на явке избирателей.
💊38😢224😁3👍2🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
В Т—Ж придумали новый забавный калькулятор — теперь вы можете посчитать стоимость ваших рабочих зумов.

Вводите количество участников, их среднюю зарплату, и смотрите, как уходят деньги. Красота!

https://journal.tinkoff.ru/nuzhen-sozvon/
😁62🔥16👍11❤‍🔥4🤔2🙈1
Красивущий и очень необычный график The Ecomonist о том, как изменились электоральные предпочтения британцев.

Необычен он сразу двумя показателями:
🔴Формой. Этот график называется Scatter Ternary Plot и помогает понять, какой из трёх показателей у определённой точки в большей степени выражен. Например, можно сравнить, какой предмет на ЕГЭ лучше сдал 11 класс школы 1544: математику, русский или английский.
🔴Динамикой. Здесь не просто показаны статичные точки, а соединены два временных интервала. Так мы можем понять, что люди, голосовавшие за «иные партии», скорее всего будут больше голосовать за партию Labour, как и голосовавшие за консервативную партию. А вот избиратели партии Labour немножко подвинулись в сторону «иных»

Эффективно? Сомнительно.
Эффектно? Точно да! И мысль основная считывается.

https://www.economist.com/britain/2024/02/28/a-changing-british-electorate-is-propelling-labour-towards-victory
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥446👍2🤔1
Ещё одна красивая визуализация процессов, напрямую связанных с нашей жизнью. Сможете угадать, какие данные тут визуализированы?

Судя по тенденции, в одной из следующих «клеточек» облачко просто улетит, и сама клеточка останется пустой 🙈

Источник: https://twitter.com/k_sonin/status/1770446059527164230/photo/1
💔42😢17😭4🤔2🐳2💊2
Страшные и впечатляющие карточки о домашнем насилии. Их выпускает проект «Считается», который ведёт статистику на эту тему в Казахстане. Есть ещё их видео, где картинки анимированы.

На самом же сайте цифры оформлены достаточно строго:
https://schitaetsya.kz/about

Здесь также стоит оговориться, что в проекте есть проблемы с виузализацией: например, на первой карточке долька пайчарта явно показывает больше, чем 51%, а на третьей карточке ось баров начинается не с 0, а с 5.
💔132👍11❤‍🔥83🤣2