data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
941 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
В тему поездок хотел поделиться фотографией, которую недавно высветил айфон.

Это 2021 год, наш небольшой оргкомитет Уральского хакатона по дата-журналистике. Мы в Екатеринбурге фотографируемся у стрит-арта, посвящённого иностранным агентам.

Два человека с этого фото вынуждены были эмигрировать, Медузу объявили нежелательной организацией, а российский Дождь просто закрыли.

Время 💔
Кстати, есть кто из Екб? Арта тоже, наверное, больше уже нет?
🕊45💔3010😢8👍6🔥2
Круговорот людей в инфографике Моны Чалаби про наём и увольнения кассиров в США.

Сама Мона пишет, что подобная «текучка» вообще характерна для всех низкооплачиваемых работ. И сокрушается, что разницы между нижним и верхним потоком почти не видно, хотя нижний поток больше.

Но, судя по цифрам, там 600 000 против 570 000. Это всё-таки небольшая разница, чтобы можно было увидеть её без больших усилий.

Источник
22😱6
7x7 рассказывает историю реестра экстремистских материалов, который задумывался для борьбы с радикальными течениями, но в итоге превратился в инструмент для преследования политических активистов и случайных людей

Внутри — комментарии пострадавших и много-много статистики, основанной на анализе текстов судебных решений.

Читать: https://lr.semnasem.org/find-extremism/ (VPN)
😢28👍2🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная работа Sheldon.studio для международного фестиваля Архитектуры, где (внезапно) рассматривают основные показатели стран — население, смертность, болезни, выбросы СO2...

В работе есть два режима — можно читать её как бесконечный дашборд, выбирая необходимый временной период или страну, а можно перейти в режим «историй», и увидеть основные выводы из такой статистики — например, узнать, что половина населения мира живёт в 7 странах, или что с 1975 года количество людей с ожирением увеличилось втрое.

Формат кажется немного спорным. Хотя, скорее всего, это работа для интерактивного экрана на выставке, куда любой может подойти, потыкать и узнать пару интересных фактов о мире. Но дизайн лично мне очень нравится. В режиме бездействия там вообще включается тёмная тема, и получается максимально эстетично 🥰

https://dataroom.seed360.org/
👍204🤔1
Обнаружил интересную рассылку SAMIZDATA — там будут публиковать дата-материалы о Восточной Европе и Центральной Азии.

В первом письме рассказывают о том, какая доля населения разных стран считает себя русскими. Из интересного — в каждом шестом регионе России русских — не большинство, зато есть отдельные районы Казахстана и стран Балтии, где живут почти только русские.

Ещё сквозь призму этой работы можно оценить качество данных в разных странах. Например, в России и Грузии доступны данные по регионам, в Казахстане, Украине и странах Балтии — по районам, а в Таджикситане, Узбекистане и Туркментистане одно число на всю страну.

https://blog.samizdata.co/p/the-myth-of-the-russian-world
👍237🤔6
Тут произошёл большой казус. Многие издания, включая РБК и даже сам сайт ФНС написали, что в 2022 году российские компании заработали 1,3 квадриллиона рублей. Один квадриллион — это 1000 триллионов, число с 15 нулями.

Эксперты это радостно подтвердили, рассказав множество версий, откуда в России появилось так много денег, да ещё и на фоне кризиса. Однако никто почему-то не предположил, что озвученное число — это просто ошибка в данных.

А вот Институт проблем правоприменения пишет, что таким расчётам просто нельзя верить. Судя по всему, журналисты просто сложили общую выручку по всем компаниям, не вникая в детали.

Однако, если изучить исходные данные, можно обнаружить, что в 2022 году больше всего денег сделала некая компания ООО «ЮССА», сделав 214 триллионов рублей и обогнав Лукойл (выручка 2.9 трлн руб.) и Магнит (2 трлн руб.). ИПП предполагает, что подобное значение — бугхалтерская ошибка. Вероятно — не единственная.

О чём это говорит?
Если у вас есть исходные данные — обязательно изучите распределение и отсутствующие значения. Возможно, перед суммированием и подсчётом средних часть данных придётся исключить или исправить.

А ещё эта история учит нас тому, что можно найти экспертов под самое безумное утверждение, подтвердив любую ошибку в данных 🙈

За подробной аргументацией отправлю вас в канал ИПП — там интересно.
👍65😁18😱115🔥3🌚2
В датавизе есть правила, от которых у новичков может вскружиться голова.

Например, у барчартов ни при каких обстоятельствах нельзя обрезать ноль. А у линейных графиков — можно и чаще всего даже нужно. А ещё есть коварный Lollipop Chart, который вроде бы очень похож на столбики, но и его можно строить не от нуля.

Всё дело в том, на какой вопрос отвечает график, и каким параметром визуализация кодирует числовые значения. В случае со столбиками — это длина. В случае с линейным и «леденцовым» графиком — координата.

Столбики предлагают нам сравнить величины целиком (на сколько одно число больше другого), линейный график отвечает на вопрос — стало больше или стало меньше — не уточняя, во сколько раз.

С другой стороны, даже обрезать ось в «леденцах» — это всё ещё сомнительный приём, и не стоит им злоупотреблять всякий раз, когда хочется выдать маленькую разницу за большую. Неплохой пример — здесь: по контексту и соотношению величин сразу очевидно, что на графике показан рейтинг, а не сравнение.

Вот и в примере, который прикреплён к этому сообщению, ничего страшного нет. Людей на графике обрезали, но очевидно, что никто не пытается сказать, что женщины в два раза ниже мужчин — потому что по силуэтам понятно, что люди изображены не в полный рост.

Источник: ролик Варламова про гендерное неравенство.

А в комментарии скину отвратительный график про рост 😈
👍163🤔3🥱2
Недавно исполнилась моя старая мечта — для проекта Sellesta.ai я «пощупал» данные о ценах в мексиканский аналог «Чёрной пятницы», который называется Hot Sale.

Времени на такой объём данных (15 миллионов цен) было у нас экстремально мало, поэтому получилось проверить только самые базовые гипотезы, не закапываясь в подробности. Но и тут вышло интересно.

1. Ухватить скидку на таких распродажах (по крайней мере, на Hot Sale) — вполне реально. Почти половина популярного ассортимента товаров в скидочную неделю стоила дешевле, чем в предшествующий месяц.
2. Однако здесь надо обратить внимание, что большая часть товаров дешевеет незначительно, в пределах пяти процентов. А чаще всего делают скидки на «виртуальные» товары — музыку, книги, видео.
3. С подешевевшими товарами есть также две загвоздки. Почти половина из тех, которые стоили дешевле в Hot Sale по сравнению с предшествующим месяцем, начали дешеветь ещё до Hot Sale. Вероятно, это и так не самые ходовые товары, на которые цена снижалась естественным образом.
А ещё на треть подешевевших за неделю до Hot Sale повышали цены. Мы не можем точно увидеть причину, но полагаем, это для того, чтобы скидка казалась больше, чем есть на самом деле.

Ну и очень мне нравятся графики, которые у нас с Надей Андриановой получилось сделать 🥰

Публикаций в мексиканских СМИ вышло много, например, такая:
https://tynmagazine.com/artificial-intelligence-hot-sale-revelo-crecimiento-del-e-commerce-gracias-a-ia/ (осторожно, испанский!)
21🔥8👍5🤔1
Давно хотел рассказать вам о дорогом своему сердцу хобби

С конца прошлого года мы вместе с певицей Крис Аивер готовили совместную песню, посвящённую эмиграции. Релиз этой песни назначен на 29 июня. Песня называется «За воздушным змеем», она раскрывает переживания друзей, находящихся по разные стороны границы. Смысл её — в надежде на объединение и мирное беззаботное лето, которое когда-нибудь должно наступить.

Грустно и иронично, но ещё пару дней назад казалось, что релиз песни придётся как раз на очередную волну эмиграции.

📊 Чтобы рассказать о релизе на канале, мы вместе с дизайнером Надей Андриановой придумали дата-арт. Я выгрузил с Авито все активные объявления, содержащие фразу «в связи с переездом в другую страну», разметил их по категориям, а Надя их виузализировала. Так мы получили примерный список вещей, которые пытаются продать или отдать эмигранты.

На каждой карточке показаны примеры объявлений из разных категорий. Этот «портрет» потерь и «оставленной жизни», конечно, не полон и точен. Однако и он даёт некоторое представление о том, чем приходится жертвовать людям. Дома и бизнесы, детские кресла и письменный стол «Успех», любимые животные — от крысы до лошади.

А как послушать песню об этом, напишу в следующем посте →
Please open Telegram to view this post
VIEW IN TELEGRAM
38🕊20👍8🥱4🔥2💔2