data hate
103 subscribers
57 photos
1 video
14 links
Авторский канал про противоречия, заблуждения и интересные факты связанные с данными.
Download Telegram
Я знаю, что я не являюсь репрезентативным. Моё окружение также не является репрезентативным. Но кто же такой типичный житель нашей страны? Чтобы разобраться в этом, я воспользовался статистическим сборником "Труд и занятость в России 2023". Если быть точным, то пунктом 1.50 (Распределение занятых по полу и группам занятий в 2022 году). Там представлена немного запутанная классификация видов деятельности. Я их перегруппировал, некоторые исключил и составил шпаргалку о том, сколько людей работает в каждой сфере. Я не претендую на абсолютную точность и пренебрёг ею ради наглядности. В сумме не получается 100%, так как я исключил некоторые редкие группы занятий.
👍2
Пока я разбирался с тем, какие профессию входят в разные виды деятельности, мне попалась интересная таблица. Оказывает есть отдельное приложение, в котором явно прописано в каком году сколько лет исполняется каждому году рождения.

Все больше убеждаюсь, что правовые акты очень похожи на код. Хотя эту табличку я бы отрефакторил и сделал все в цикле)
Хватит сравнивать капитализацию и ВВП. Оставим в стороне, насколько раздута или не раздута капитализация компании. ВВП — это стоимость всех товаров и услуг за год, а капитализация — это стоимость компании не за год, а в принципе. Это как сказать: «Пипец, ты богатый. У тебя в собственности квартира, которая стоит на порядок дороже, чем средняя зарплата по стране».

Если хотите сравнить капитализацию Nvidia со страной, то нужно сравнивать её с ценой страны. То есть, во сколько вы оцениваете стоимость всей государственной собственности.

Или по-другому: если хотим сравнивать с ВВП страны, то давайте сравнивать не капитализацию, а выручку. То есть, стоимость товаров и услуг со стоимостью товаров и услуг. Выручка Nvidia за прошлый год составила $26 млрд, что сопоставимо с ВВП таких стран, как Армения и Судан. Это всё равно много, но не настолько много, как вам это пытаются преподнести.
👍7
Я уже писал пост о том, почему я не разделяю всеобщую любовь к медиане. https://t.iss.one/datahate/22 Краткое содержание этого поста: Ни среднее арифметическое, ни медиана не являются идеальными. Нельзя однозначно утверждать, что одна статистическая мера лучше другой. У каждой из этих двух мер есть свои плюсы и минусы. Однако медиана более сложна для понимания. Среднее арифметическое изучается в начальной школе, а медиана — уже в вузе. Что такое среднее арифметическое, знают все, а вот что такое медиана, многим приходится объяснять. Поэтому при проведении исследований и написании статей для широкой аудитории использование медианы может быть менее предпочтительным.
А сейчас я объясню на примере выборов президента США, в чем медиана может быть хуже среднего.
В сервисе Яндекс Недвижимости есть тепловая карта, которая показывает доступность каршеринга Яндекс Драйв. Методику они описывают следующим образом:

В каждом из квадратов посчитали отношение количества запусков приложения Яндекс Драйв к количеству начавшихся поездок. На основе этого присвоили оценку квадрату от 0 до 8. Ноль — это зона, в которой очень часто открывают приложение, но редко начинают поездку; восемь — зона, в которой открытие приложения чаще всего заканчивается началом поездки.


Я бы считал эту доступность по-другому — привязался бы к наличию свободных машин или среднему времени до свободной машины. Может быть, что-то более хитрое, но точно связанное с тем, насколько далеко мне идти до ближайшей машины.

Вроде бы конверсия открытия в поездку тоже неплохой показатель. А что, если есть районы, из которых я вынужден в любом случае уехать на каршеринге, как бы далеко машина ни находилась?
Неожиданно в Atomic Heart я увидел рекламу Пятерочки. Погуглил - оказывается у них целая целая коллаборация.
👍2