data.csv
13.5K subscribers
1.34K photos
80 videos
6 files
973 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Эти красивые картинки нарисовали мои коллеги из Бюро точных исследований.

Они занимаются поиском, интерпретацией и анализом данных, визуализируют сложные процессы, помогают автоматизировать и настраивать аналитику, и теперь за исследованиями к ним можете прийти и вы.

В команде много знакомых мне и чудесных коллег — аналитики, учёные, дата-журналисты, инфограферы и редакторы.

А сайт у них — заглядение:
https://www.precise.agency/
33😍12🔥8❤‍🔥4
Как люди используют ChatGPT

OpenAI выпустили большое исследование, где рассказали, как люди используют их модели. Что показалось интересным мне:

🔗Модель — не инструмент, модель — друг. В июне 2024 года сообщений, очевидно связанных с работой, было 47%, а к июню 2025 их доля снизилась до 27%! Касается это как новых пользователей, так и тех, кто пользуется нейронкой уже давно.
🔗Три самых частых темы: советы «как что-то сделать», запрос фактов и работа с текстом.
🔗Запросы всё больше про «попросить совета», а не «сделай за меня». Количество сообщений в категории Asking растёт, а Doing — падает. То есть люди всё чаще обсуждают и советуются с моделью, а не просто поручают ей задачу.
🔗Самый высокий уровень удовлетворённости — в личных разговорах. Пользователи чаще всего довольны, когда обсуждают свои мысли и эмоции, а не решают технические задачи. В таких диалогах соотношение положительных реакций к отрицательным превышает 7 к 1 — для сравнения, в технических темах оно около 2 к 1.
🔗В начале ChatGPT был почти полностью «мужским клубом» (80 % имён — мужские). Однако сейчас — баланс, женских имён 52%.
Please open Telegram to view this post
VIEW IN TELEGRAM
29🔥10😍9🤔6🌚3👍2
Может ли ИИ заменить вас на работе?

На этот вопрос пытаются ответить журналисты The Economist, ссылаясь на новую научную работу исследователей из Гарварда.

Учёные проанализировали 200 миллионов вакансий и обнаружили: в компаниях, где нанимали специалистов по внедрению ИИ, наём младших сотрудников за шесть кварталов упал на 7,7% сильнее, чем у прочих. В то же время спрос на «сеньоров» не только не просел — он стабильно продолжает расти.

Иными словами, ИИ пока не отнимает работу у всех — но точечно сокращает спрос на джуниоров. Особенно тех, кто делает умственно тяжёлую, но рутинную работу: от дебага до проверки документов.

Интересно и другое: хуже всего приходится тем, кто окончил вузы среднего уровня.
Компании по-прежнему нанимают людей из топ-университетов — их навыки сложнее автоматизировать. Выпускники слабых вузов тоже остаются в игре: они просто не просят много денег.

А вот средний уровень оказывается слишком дорогим для рутинных задач и недостаточно квалифицированным для сложных.

Паниковать пока рано: в Штатах 17% работников заняты у компаний, активно внедряющих ИИ. Но если тенденция сохранится, вход в профессию может стать сложнее, чем когда-либо.

Оригинал без пейволла
30🤔81🔥1
Т—Ж в одной картинке показал, как выглядит взросление: за 6 лет фрукты в покупках молодых людей взлетают с 9 на 5 место, а снеки улетают с 4 на 6.

Что ещё покупают в супермаркетах в 17—23 года? Конечно — энергетики. В целом доля чеков с ними составляет 15%, а у мужчин достигает 19.

Батоны и пирожки можно найти в 18% чеков, заморозку (пельмени, котлеты и прочие полуфабрикаты) — в 9,3%, «дошик» — в 3,4%.

Кстати, по данным Т—Банка, в среднем молодые люди тратят 354 ₽ за один поход в продуктовый. Пойду брать у своих студентов уроки финансовой грамотности — кажется, они в этом шарят 🫤

https://t-j.ru/what-students-eat/
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3118🔥3🤔1
Подписывать ли все значения на графике?

В чате выпусников моего курса в очередной раз разгорелась дискуссия — о том, насколько целесообразно подписывать ВСЕ значения на самом графике. Вот как тут, в примере.

Моя базовая позиция звучит так:
Не надо.

Визуализация показывает общий тренд и идеи, заложенные в данных. Если для понимания этих идей нам надо прочитать 100 чисел глазами, это плохая визуализация

Внимания достойны отдельные точки — например, экстремумы или что-то выделяющееся по другой причине. Всё остальное должно быть приблизительно читаемо благодаря осям, линиям сетки и другим ориентирам.

Обычно я слышу несколько ситуаций, в которых людям нужны все числа:

— Это исследователи, которые потом используют эти числа в своих работах. Таким людям надо просто дать исходную базу данных, а не пытаться переписать все значения на график

— Это руководители, которые не видят инсайта из графиков сотрудников, либо не доверяют результатам — и пытаются прикинуть всё самостоятельно. Возможно, тут со стороны сотрудника надо фиксить умение визуализировать данные, а со стороны руководителя — доверие.

Но есть ли ещё кейсы? Я хочу послушать ваше мнение. Если вам по каким-то причинам надо знать все 100 цифр на графике с максимальной точностью, напишите в комментариях — зачем⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
32👍8🤯2😭2
deluliu, ngl, sigma, huzz — вот одни из немногих трендовых словечек, которые благодаря распространению соцальных сетей теперь употребляют не только американские подростки, но и их сверстники в других странах

Хотите почувствовать себя старым?
Попробуйте себя в тесте от WP на знание молодёжного сленга:

https://www.washingtonpost.com/opinions/interactive/2025/teen-slang-quiz-delulu/
😁153🤯3
В ближайшее время посты тут, вероятно, будут выходить реже обычного, потому что я отправляюсь, наверное, в самый длительный свой отпуск.

В планах Австралия, Сингапур, праздник фонарей в северном Таиланде и бухарское биеналле. По традиции, находки визуализации на улицах других стран буду скидывать сюда. А если захотите почитать про приключения, то сделать это можно будет в моём личном канале:

» в глазах смотрящего
2🔥8631👍6🤔2
Набор данных, который больше всего впечатлил меня в Мельбурне

… встретился в, пожалуй, самом интересном местном музее города — Старой тюрьме Мельбурна (Old Melbourne Goal).

Историческое тюремное здание сегодня принимает туристов и рассказывает жуткие истории 19-20 веков. В то время особо опасных преступников казнили через повешание, и в одной из комнат даже можно увидеть полный поимённый список казнённых — с 1842 по 1967 годы.

Визуализации тут нет, но надо сказать, что табличка с именами убитых производит впечатление куда большее, чем столбики или даже иконки. Хотя разбивку по годам, типам преступлений и стране рождения было бы глянуть интересно.

Говорят, что среди первых заключённых было много аборигенов, потому что с местным населением они, по понятным причинам, дружить не хотели.

Кто пропустил, заметки, не связанные с данными, я буду публиковать тут:

»
в глазах смотрящего
🔥2215🤯3🤔1
Занятная схема повстречалась мне в Китайском саду в Сиднее

На ней конкретные точки обозначены не локаторами с цифрами (поди найди, где на таких картах 1, а где 51), а выбран другой подход: вся карта разбита на сектора — как в таблицах

Например, главный вход L11, а туалеты — K5.

Как вам? Ставьте 🔥, если удобно
🔥89🤔25102🤝1🆒1
Нейросетевые фичи раскатили на Яндекс Таблицы

Коллеги на днях совершили большой запуск — глобальный апдейт нашей большой языковой модели. Алиса теперь не только стала умнее, но ещё и «проросла» в другие сервисы Яндекса: в Go [пока в режиме закрытого бета-теста] при помощи нейросети можно забронировать столик в ресторане, в Браузере — дать задачу ии-агентам: например, найти какой-то товар на сайте. Но самое долгожданное для меня обновление — это апдейт Яндекс Таблиц. Теперь можно прямо в эксельке закрывать разные нетривиальные задачи, связанные с данными.

К примеру:
— Определить пол человека по его имени;
— Определить континент по названию страны;
— Перевести с одного языка на другой.

Как этим пользоваться

1. Перейти на https://docs.yandex.ru/
2. Создать новую таблицу (проверьте, что у вас включён переключатель «Перейти на новый редактор»)
3. Использовать формулу =АЛИСАПРО(<ПРОМПТ>;<ЯЧЕЙКА С ДАННЫМИ>)

Предостережение 1. При помощи LLM не стоит решать задачи, которые легко решаются стандартным формульным функционалом (складывать числа, искать среднее, выделять первый символ и так далее). Модели имеют свойство ошибаться, и эта ошибка оправдана только там, где нет альтернативы.

Предостережение 2. Качество работы любых моделей зависит от того, насколько грамотно вы напишете промпт. Иногда имеет смысл расписать задачу подробно, а не просто парой слов.

Работает это бесплатно. Наверняка есть какие-то ограничения по количеству данных, которые можно таким образом обработать — но в релизах я не нашёл ничего про лимиты. Попробуйте и расскажите в комментариях.
🔥29🤣11🤝102🙉2😭1
мы!
8
У канала 3 тысячи подписчиков! Вас так много 🤩

Мы хотим рассказать, кто делает этот канал, чтобы познакомиться поближе. Заодно этим постом запускаем рубрику #почему — короткие разборы ошибок и приёмов визуализации данных. Так можно с пользой посмотреть на наши лица.

В прошлый раз мы заказывали пиццу, а в этом выпуске на собственном примере рассказываем, почему нельзя обрезать столбики в столбиковой диаграмме (её ещё называют «барчарт»).

Напишите в комментариях, если догадались, постер какого фильма мы пытались повторить 😎


Исследования Яндекса @YaResearches
❤‍🔥54🥰10🆒6🔥1