data.csv
13.2K subscribers
1.25K photos
77 videos
6 files
941 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Красивая визуальная история, в которой FT рассказывает про принцип работы квантовых компьютеров и объясняет, как их появление изменит безопасность в интернете.

Если коротко — популярный алгоритм шифрования RSA (именно он часто используется для защиты данных) основан на математическом парадоксе. Мы легко можем умножить два числа, но иногда с большим трудом можем найти два множителя по их произведению. Если результат умножения — очень большое число (из сотен цифр), поиск множителей может стать бесконечным перебором, который в обозримое время не могут закончить даже суперкомпьютеры.

Квантовые же компьютеры смогут решать такие задачи намного быстрее, однако на текущий момент все их прототипы крайне нестабильны.

Посмотреть:
https://ig.ft.com/quantum-computing/
🔥17👍54
Каждый из этих графиков показывает прогноз изменения ВВП России в 23-24 году. С 24 февраля 2022 года Россия последовательно закрывает данные, по которым можно оценить благосостояние страны, и проверить официальный прогноз становится всё сложнее. Впрочем, даже в таких условиях оценка Банка России кажется одной из самых умеренных! Именно об этой неопределённости рассказывает в своём материале Wall Street Journal.

Хочется обратить внимание и на сам график — в нём есть несколько интересных деталей:
1. Любопытно, что визуализация оформлена в виде серии маленьких графиков, на каждом из которых показаны одни и те же данные, но сделаны разные акценты. Благодаря такой композиции все линии не сливаются в кашу, но при этом можно легко увидеть где текущая оценка относительно других.
2. Очень часто «дублирование» какого-то значения цветом считается плохим тоном. Но из этого правила есть исключения — в частности, хорошо цветом показывать направление изменения (больше 0 / меньше 0, увеличилось / уменьшилось). Вот и здесь — сразу видно, какие прогнозы в большей степени благоприятные, а какие — в меньшей.
3. Плохо, что нигде на графике не указано, какие проценты на нём визуализированы. Это год к году? Или это изменение с 2021 года?
Хороший график не должен оставлять таких вопросов и должен быть понятен в отрыве от текста.

Читать:
https://www.wsj.com/articles/is-russias-economy-growing-or-shrinking-it-depends-on-the-forecaster-41e7af0c

Вероятно, для просмотра потребуется подписка или расширение Bypass Paywalls
17👍9
Совместная работа проекта Chit Chart и Female Fashion Collective о том, кто фотографирует моделей для модных журналов и агенств.

Перекос такой — девушки снимаются, а мужчины — снимают.
Без контекста может показаться, что на первой картинке речь о модели на обложке, но, как я понял, вся инфографика — про фотографов.

Посмотреть все картинки можно тут:
https://www.femalefashioncollective.com/8384388-statistics

Как вам такие визуальные метафоры? Приветствуете их или выступаете исключительно за строгие графики?
Мне кажется, что в данном случае это уместно и идёт на пользу виральности картинок. Вопросы вызывает только пайчарт в искажённой проекции, но так как здесь максимально простые и понятные данные, то можно и простить ☺️
20👍9💔2
NYT рассказывает, что Китай занял прочное лидерство в сфере литий-ионных аккумуляторов, и практически любой стране приходится с ним сотрудничать.

Почему это важно? Ответ из первого абзаца материала:
«это одно из определяющих соревнований нашего времени: страны, которые могут производить аккумуляторы для электромобилей (а они именно литий-ионные, прим. автора канала), будут десятилетиями пользоваться экономическими и геополитическими преимуществами»

Но вообще я хочу обратить ваше внимание на графики. Здесь можно было визуализировать абсолютно всё столбиками, что сделало бы и без того тяжёлый материал сугубо экспертным.
А так — яркие и понятные картинки всё-таки оставляют шанс 🙂

https://www.nytimes.com/interactive/2023/05/16/business/china-ev-battery.html?referringSource=articleShare

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
19🔥6👍3🤯2
Сразу две новости от «Новой газеты Европа»:

1) Во-первых, редакция приглашает всех желающих на бесплатную летнюю школу по журналистике — где, в том числе, можно будет научиться журналистике данных. Для участия нужно «уверенно» понимать английский и предложить тему своего проекта. Подробности тут: https://novayagazeta.eu/summerschool
2) Во-вторых, дата-отдел ищет себе нового коллегу. Если вы уже имеете опыт работы с данными, читайте подробности: https://www.instagram.com/p/CsWffjdNnwa/

Коллеги делают классные проекты, поэтому не упускайте свои шансы 🌿
👍27🙏7
Т—Ж сделали занятный материал про знакомства на данных сервиса «Мамба». Меня особенно зацепил бамп-чарт, который рассказывает, как меняются цели пользователей в зависимости от возраста.

У женщин тут целая драма — молодые хотят поскорее найти себе жениха, а уже после 40 на первое место в рейтинге целей выходят просто отношения.

График классный, но немного поворчу — здесь опять не подумали о читателях, которые такую визуализацию видят впервые.
Если вы тоже будете делать бамп-чарты, не забудьте объяснить, как такой график читать. В комментариях к этому посту закидывал несколько идей.

https://journal.tinkoff.ru/dating-apps-stat/
👍248🤔3😁2🌭1
Яндекс выпустил исследование о российских улицах, в названии которых людям слышатся животные.

Большинство улиц по мнению людей связаны с птицами, кошек в топонимах больше, чем собак, а муха подчистую побеждает слона:

https://yandex.ru/company/researches/2023/animal-streets
29😁18🗿7👎3
Так сложилось, что в этом канале я в основном рассказываю про новинки в сфере дата-журналистики. Однако много восхитительных проектов остаются «за кадром» или даже в архивах канала. И люди, которые только начинают интересоваться нашей сферой, не имеют возможностей о них узнать.

Я предлагаю вам небольшой интерактив! Поделитесь в комментариях своими любимыми работами в сфере визуализации данных и дата-журналистики. Давайте вместе пополним свою копилку классных работ. Я начну:

1. Bussed out / The Guardian / Shirley Wu
Впечатляющий симбиоз классической журналисткой работы и дата-исследования. Материал рассказывает о национальной программе США, в рамках которой бездомные получают «билет в один конец», чтобы изменить своё место жительства. Некоторые из них воссоединяются с родственниками, некоторые получают возможность переехать в штат мечты и закрепляются за местной церковью, некоторые — ищут поддержку у друзей.

Эта работа мне нравится свой эстетикой — тут очень красивые анимации, элегантные графики и классные фото-видео вставки. За датавиз-часть отвечала Shirley Wu — про неё я шутил, что хочу быть как она, «когда я вырасту». У Shirley в портфолио действительно много красоты, советую заглянуть ещё туда.

2. Women’s Pockets Are Inferior / The Pudding
Простая в своей идее работа рассказывает о том, что карманы в женских джинсах кошмарно малы. Для своего исследования The Pudding использовали малый набор данных — вручную измерили карманы в 80 парах джинс 20 популярных брендов (мужские, женские, скинни и прямые для каждого бренда). Оказалось, что женские карманы почти в два раза короче и даже немного уже, чем мужские.

Главная прелесть работы — в подаче. Во-первых, иллюстратор не стал делать простые столбики, а в действительности нарисовал, как выглядят карманы. А во-вторых, здесь подкупает интерактивная часть, где можно положить в карманы разные предметы — от айфона до руки — и наглядно увидеть, как они там «сидят».

Ну всё, теперь жду ваши любимые проекты 🙂
🔥38👍98
А чего почти все смотрят, а проектами не делятся? 👀💔

спишу всё на сообщение в разграр рабочего дня
но вообще-то ещё не поздно ☝️
10😁7💔6
This media is not supported in your browser
VIEW IN TELEGRAM
Залипательный скроллителлинг у Washington Post в материале про цены на жильё. Каждой точкой обозначен один из округов США, анимация показывает, как цены (в процентах) менялись за каждый месяц. Чем-то похоже на пузырики, которые всплывают в газировке 🫧

Помимо красоты, у этой анимации большой функционал: в статике было бы крайне сложно показать нюансы ценообразования в зависимости от времени. Получилась бы либо «лапша» из линейных графиков, либо пришлось бы сильно жертвовать детализацией.

P.S. Скроллителлинг — это механика, при которой часть сайта меняется вместе с прокруткой страницы. Вы скроллите, на экране появляются новые надписи, график перестраивается.

https://www.washingtonpost.com/business/interactive/2023/housing-market-price-trends/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
18🔥6👍3🤔1😎1
ТАСС экспериментирует с «Лицами Чернова», чтобы визуализировать данные о том, сколько россиян ведут здоровый образ жизни в разных федеральных округах.

Википедия сообщает, что «лица Чернова являются одним из самых эффективных способов визуализации многомерных данных», но у меня этот пример вызывает в лучшем случае улыбку — слишком уж сложно здесь извлечь какую-либо информацию.

На сайте Википедии, кстати, представлен более хороший пример — кажется, что там проще уловить какие-то отличия, потому что лица сильнее отличаются друг от друга.

В комментарии закину материал, в котором лица Чернова, на мой вкус, сработали неплохо. А вы проголосуйте, как вам визуализация ТАСС — нравится (🥰), не нравится (🗿)?
🗿135🥰18🤨8❤‍🔥11👎1
Впервые с республиканским языком я столкнулся в 2017 году, когда ездил с другом в Казань. Во второй раз — год назад, когда впервые прилетел в Сыктывкар. Тогда мне показалось удивительным, что улицы в городах подписаны дважды, а где-то «между строк» существует ещё и второй язык, помимо русского, который как будто не использует никто вокруг.

Оказалось, русский язык вытеснил на второй план не только языки регионов нашей страны, но и языки других стран. Может показаться парадоксальным, но не все кореные жители Душанбе в совершенстве владеют таджикским.

Вместе с автором CABAR.asia Наврузом Каримовым мы исследовали, как таджикский используют в интернете, и пришли к ещё более неутешительным результатам — таджикистанцы почти по любым темам обращаются в Google на русском языке. Редкие исключения — почти всегда слова, описывающие местный быт и кухню (шурпа, лепёшка, мечеть, Шайтан).

Узнать причины этого явления и подробно рассмотреть графики можно тут:
https://cabar.asia/ru/yazykovye-predpochteniya-v-tadzhikistane-chto-govoryat-dannye-poiskovyh-zaprosov

P.S. Это первое исследование, которое вышло у меня в рамках менторской поддержки журналистов в Таджикситане. В этом месяце будут и другие материалы — поделюсь с вами, с какими сложностями мы там столкнулись 🙂
🔥47👍9😢8❤‍🔥4🤔2💔2
В тему поездок хотел поделиться фотографией, которую недавно высветил айфон.

Это 2021 год, наш небольшой оргкомитет Уральского хакатона по дата-журналистике. Мы в Екатеринбурге фотографируемся у стрит-арта, посвящённого иностранным агентам.

Два человека с этого фото вынуждены были эмигрировать, Медузу объявили нежелательной организацией, а российский Дождь просто закрыли.

Время 💔
Кстати, есть кто из Екб? Арта тоже, наверное, больше уже нет?
🕊45💔3010😢8👍6🔥2
Круговорот людей в инфографике Моны Чалаби про наём и увольнения кассиров в США.

Сама Мона пишет, что подобная «текучка» вообще характерна для всех низкооплачиваемых работ. И сокрушается, что разницы между нижним и верхним потоком почти не видно, хотя нижний поток больше.

Но, судя по цифрам, там 600 000 против 570 000. Это всё-таки небольшая разница, чтобы можно было увидеть её без больших усилий.

Источник
22😱6
7x7 рассказывает историю реестра экстремистских материалов, который задумывался для борьбы с радикальными течениями, но в итоге превратился в инструмент для преследования политических активистов и случайных людей

Внутри — комментарии пострадавших и много-много статистики, основанной на анализе текстов судебных решений.

Читать: https://lr.semnasem.org/find-extremism/ (VPN)
😢28👍2🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная работа Sheldon.studio для международного фестиваля Архитектуры, где (внезапно) рассматривают основные показатели стран — население, смертность, болезни, выбросы СO2...

В работе есть два режима — можно читать её как бесконечный дашборд, выбирая необходимый временной период или страну, а можно перейти в режим «историй», и увидеть основные выводы из такой статистики — например, узнать, что половина населения мира живёт в 7 странах, или что с 1975 года количество людей с ожирением увеличилось втрое.

Формат кажется немного спорным. Хотя, скорее всего, это работа для интерактивного экрана на выставке, куда любой может подойти, потыкать и узнать пару интересных фактов о мире. Но дизайн лично мне очень нравится. В режиме бездействия там вообще включается тёмная тема, и получается максимально эстетично 🥰

https://dataroom.seed360.org/
👍204🤔1
Обнаружил интересную рассылку SAMIZDATA — там будут публиковать дата-материалы о Восточной Европе и Центральной Азии.

В первом письме рассказывают о том, какая доля населения разных стран считает себя русскими. Из интересного — в каждом шестом регионе России русских — не большинство, зато есть отдельные районы Казахстана и стран Балтии, где живут почти только русские.

Ещё сквозь призму этой работы можно оценить качество данных в разных странах. Например, в России и Грузии доступны данные по регионам, в Казахстане, Украине и странах Балтии — по районам, а в Таджикситане, Узбекистане и Туркментистане одно число на всю страну.

https://blog.samizdata.co/p/the-myth-of-the-russian-world
👍237🤔6
Тут произошёл большой казус. Многие издания, включая РБК и даже сам сайт ФНС написали, что в 2022 году российские компании заработали 1,3 квадриллиона рублей. Один квадриллион — это 1000 триллионов, число с 15 нулями.

Эксперты это радостно подтвердили, рассказав множество версий, откуда в России появилось так много денег, да ещё и на фоне кризиса. Однако никто почему-то не предположил, что озвученное число — это просто ошибка в данных.

А вот Институт проблем правоприменения пишет, что таким расчётам просто нельзя верить. Судя по всему, журналисты просто сложили общую выручку по всем компаниям, не вникая в детали.

Однако, если изучить исходные данные, можно обнаружить, что в 2022 году больше всего денег сделала некая компания ООО «ЮССА», сделав 214 триллионов рублей и обогнав Лукойл (выручка 2.9 трлн руб.) и Магнит (2 трлн руб.). ИПП предполагает, что подобное значение — бугхалтерская ошибка. Вероятно — не единственная.

О чём это говорит?
Если у вас есть исходные данные — обязательно изучите распределение и отсутствующие значения. Возможно, перед суммированием и подсчётом средних часть данных придётся исключить или исправить.

А ещё эта история учит нас тому, что можно найти экспертов под самое безумное утверждение, подтвердив любую ошибку в данных 🙈

За подробной аргументацией отправлю вас в канал ИПП — там интересно.
👍65😁18😱115🔥3🌚2
В датавизе есть правила, от которых у новичков может вскружиться голова.

Например, у барчартов ни при каких обстоятельствах нельзя обрезать ноль. А у линейных графиков — можно и чаще всего даже нужно. А ещё есть коварный Lollipop Chart, который вроде бы очень похож на столбики, но и его можно строить не от нуля.

Всё дело в том, на какой вопрос отвечает график, и каким параметром визуализация кодирует числовые значения. В случае со столбиками — это длина. В случае с линейным и «леденцовым» графиком — координата.

Столбики предлагают нам сравнить величины целиком (на сколько одно число больше другого), линейный график отвечает на вопрос — стало больше или стало меньше — не уточняя, во сколько раз.

С другой стороны, даже обрезать ось в «леденцах» — это всё ещё сомнительный приём, и не стоит им злоупотреблять всякий раз, когда хочется выдать маленькую разницу за большую. Неплохой пример — здесь: по контексту и соотношению величин сразу очевидно, что на графике показан рейтинг, а не сравнение.

Вот и в примере, который прикреплён к этому сообщению, ничего страшного нет. Людей на графике обрезали, но очевидно, что никто не пытается сказать, что женщины в два раза ниже мужчин — потому что по силуэтам понятно, что люди изображены не в полный рост.

Источник: ролик Варламова про гендерное неравенство.

А в комментарии скину отвратительный график про рост 😈
👍163🤔3🥱2