data.csv
13.5K subscribers
1.34K photos
80 videos
6 files
973 links
Блог о журналистике данных и дата-сторителлинге
Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Download Telegram
Набор данных, который больше всего впечатлил меня в Мельбурне

… встретился в, пожалуй, самом интересном местном музее города — Старой тюрьме Мельбурна (Old Melbourne Goal).

Историческое тюремное здание сегодня принимает туристов и рассказывает жуткие истории 19-20 веков. В то время особо опасных преступников казнили через повешание, и в одной из комнат даже можно увидеть полный поимённый список казнённых — с 1842 по 1967 годы.

Визуализации тут нет, но надо сказать, что табличка с именами убитых производит впечатление куда большее, чем столбики или даже иконки. Хотя разбивку по годам, типам преступлений и стране рождения было бы глянуть интересно.

Говорят, что среди первых заключённых было много аборигенов, потому что с местным населением они, по понятным причинам, дружить не хотели.

Кто пропустил, заметки, не связанные с данными, я буду публиковать тут:

»
в глазах смотрящего
🔥2215🤯3🤔1
Занятная схема повстречалась мне в Китайском саду в Сиднее

На ней конкретные точки обозначены не локаторами с цифрами (поди найди, где на таких картах 1, а где 51), а выбран другой подход: вся карта разбита на сектора — как в таблицах

Например, главный вход L11, а туалеты — K5.

Как вам? Ставьте 🔥, если удобно
🔥89🤔25102🤝1🆒1
Нейросетевые фичи раскатили на Яндекс Таблицы

Коллеги на днях совершили большой запуск — глобальный апдейт нашей большой языковой модели. Алиса теперь не только стала умнее, но ещё и «проросла» в другие сервисы Яндекса: в Go [пока в режиме закрытого бета-теста] при помощи нейросети можно забронировать столик в ресторане, в Браузере — дать задачу ии-агентам: например, найти какой-то товар на сайте. Но самое долгожданное для меня обновление — это апдейт Яндекс Таблиц. Теперь можно прямо в эксельке закрывать разные нетривиальные задачи, связанные с данными.

К примеру:
— Определить пол человека по его имени;
— Определить континент по названию страны;
— Перевести с одного языка на другой.

Как этим пользоваться

1. Перейти на https://docs.yandex.ru/
2. Создать новую таблицу (проверьте, что у вас включён переключатель «Перейти на новый редактор»)
3. Использовать формулу =АЛИСАПРО(<ПРОМПТ>;<ЯЧЕЙКА С ДАННЫМИ>)

Предостережение 1. При помощи LLM не стоит решать задачи, которые легко решаются стандартным формульным функционалом (складывать числа, искать среднее, выделять первый символ и так далее). Модели имеют свойство ошибаться, и эта ошибка оправдана только там, где нет альтернативы.

Предостережение 2. Качество работы любых моделей зависит от того, насколько грамотно вы напишете промпт. Иногда имеет смысл расписать задачу подробно, а не просто парой слов.

Работает это бесплатно. Наверняка есть какие-то ограничения по количеству данных, которые можно таким образом обработать — но в релизах я не нашёл ничего про лимиты. Попробуйте и расскажите в комментариях.
🔥29🤣11🤝102🙉2😭1
мы!
8
У канала 3 тысячи подписчиков! Вас так много 🤩

Мы хотим рассказать, кто делает этот канал, чтобы познакомиться поближе. Заодно этим постом запускаем рубрику #почему — короткие разборы ошибок и приёмов визуализации данных. Так можно с пользой посмотреть на наши лица.

В прошлый раз мы заказывали пиццу, а в этом выпуске на собственном примере рассказываем, почему нельзя обрезать столбики в столбиковой диаграмме (её ещё называют «барчарт»).

Напишите в комментариях, если догадались, постер какого фильма мы пытались повторить 😎


Исследования Яндекса @YaResearches
❤‍🔥54🥰10🆒6🔥1
Как отличаются дни мужчин и женщин

Нейтан Яу продолжает выуживать интересные инсайты из данных большого опросника American Time Use Survey.

Любопытно, что почти всё делают больше в течение дня — женщины. Уход за собой, уборка дома, уход за членами семьи, звонки по телефону, покупки.

У мужчин лидирует работа, спорт и... общение с другими людьми. Судя по всему, с другими мужчинами 👀

https://flowingdata.com/2025/11/04/spend-days-men-women-2024/
27😁25💔16
Смешной формат придумала команда аналитики FlyByMetrics

Они проанализировали telegram-канал бывшего президента России Дмитрия Медведева и нашли в нём уникальные слова —

⭕️почти не используемые (в базе словаря современного русского языка Ляшевской и С.А.Шарова менее 0,4 раза на 1 млн слов) — педикулез, шобла, наркоклоун, самокастрация
⭕️ крайне редкие (примерно 0,4 раза на 1 млн слов в корпусе словаря) — дефекация, русофобский, маразматик, псалтирь, шагреневый, дегенеративный.

Интересно теперь посмотреть на каналы других известных персон 🌚

А больше интересной аналитики на основе данных Telegram, YouTube, Instagram и других социальных платформ — в их канале FBM API Insights.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3413🔥5🤔4👍2