Data Wondering
447 subscribers
49 photos
3 videos
44 links
A place where curiosity meets data. AI / DS / ML / HealthTech
Boost link: https://t.iss.one/data_wondering?boost
By @dmitryserg
Download Telegram
Про визуализацию данных
#DataViz #HealthTech #ŌURA

В одном из недавних постов Оуры в инсте был любопытный график — сравнение точности классификации фаз сна между нашим кольцом и обычным порошком другими девайсами. Сравнение, бесспорно, в пользу Оуры. Нас недавно в очередной раз тестировали независимые институты и результаты кольца оказались самими близкими к медицинскому стандарту — полисомнографии.

Но сейчас не об этом. На графике с тремя столбцами (он же bar chart), в лучших традициях How To Lie with Statistics, самый маленький столбец визуально отличается от самого большого ровно в два раза. При том, что абсолютное отличие составляет всего 5.4%.

Если бы график строили по всем правилам, со значениями, начинающимися с нуля, то высота первого столбца была бы всего на ~7.5% больше последнего (что, конечно, не так эффективно продается).

Ту же самую информацию можно было бы преподнести корректнее и даже с таким же визуальным вау эффектом. Вместо абсолютных значений качества, взять отклонение от медицинского золотого стандарта — ручной разметки фаз сна. В среднем, когда исследователи вручную размечают PSG данные, коэффициент согласия составляет примерно 80% (то есть одни и те же сегменты/фазы сна специалисты могут разметить по-разному в 20% случаев):

Overall, even the gold-standard PSG is subject to classification errors and inter-scorer differences. There is an average agreement of 80% between human scorers of PSG [source]


Это означает, что гипотетический идеальный Sleep Staging алгоритм может достигнуть максимум 80% точности. Считаем от этого отклонения и получаем, что Oura всего в 3.7% от идеала, в то время как “Wearable 2” нужно добить 9.1% — визуально даже больше, чем двукратное преимущество у кольца.

Про качественные визуализации и грамотное построение графиков есть много годных книг, порекомендую вот эти (осталось только нашим SMM тоже их пролистать):

📕 Storytelling with Data: A Data Visualization Guide for Business Professionals [тык]

📗 How Charts Lie: Getting Smarter about Visual Information [тык]
12😁6👍4🔥2
Открытая лекция
#OTUS

Сегодня вечером в 20:00 по Москве буду рассказывать в Отусе про "Структуру и построение ML команды”. Расскажу, из кого состоит ML/DS команда и как её нормально строить, чтобы нормально было.

Приходите послушать, посмотреть на мемы, и поддержать лайком. Ссылка на мероприятие [тык]. За 5 минут до начала еще скину прямую ссылку на трансляцию.
🔥64👍1
Пятничная подборка качественного контента 🥂
#memes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8
Открытая лекция
#OTUS

Сегодня снова в 20:00 по Москве проведу открытый урок [тык]. На этот раз будем говорить про карьерные пути в этом нашем дата сайенсе и что должен делать тимлид для развития своей команды.

Ссылку на трансляцию закину в комментарии за 5 минут до начала :)
9
📲 Рекомендация — если вам интересно попробовать себя в AI Safety и вы считаете, что у кожаных мешков всё ещё есть шанс, то есть отличная возможность, с которой может помочь мой друг Вася. Далее текст от него:

🎓 Стипендиальная программа Impact Academy для технических исследователей безопасности ИИ


Мы — сообщество Unitaware. Ищем амбициозных и талантливых людей в области ML/AI для участия в стипендиальной программе Impact Academy по безопасности ИИ. Это шанс проводить исследования и работать с лидерами индустрии — и получить от них приглашения в топовые AI safety лабы и проекты (например, Center for Human-Compatible Artificial Intelligence, FAR AI и Mila AI Institute)

💼 Что вас ждет?

• Оффлайн программа (3-6 месяцев с марта) в Сингапуре, Англии или США.
• Исследования и коучинг в сфере AI safety.
• Стипендия ~$5000/мес.
• Перспектива работы в ведущих AI-проектах.

👤 Кого мы ищем?

• Отличный английский и опыт в ML/DL (публикации, стажировки, проекты).
• Программирование на уровне ведущей техкомпании.
• Достижения: олимпиады или учеба на топовых кафедрах.
• Интерес к снижению рисков от продвинутых AI-систем.

Срок подачи: до 31 декабря (лучше до первой недели декабря).

Если заинтересовались или знаете подходящего кандидата, напишите @vakondyrev, это максимизирует шансы при прочих равных. За рекомендацию подходящего кандидата также предусмотрено вознаграждение
Please open Telegram to view this post
VIEW IN TELEGRAM
141
Dog Poop Compass: Bayesian Analysis of Canine Business
#DataWondering

Как и многие владельцы собак, во время прогулок с Аури я всё время наблюдаю один и тот же ритуал. Перед тем, как приняться за пёсьи дела, он каждый раз много-много раз крутится вокруг своей оси, пока не выстроится поудобнее.

В один прекрасный момент я начал делать скриншоты компаса, чтобы когда-нибудь оценить, а рандомно ли собака усаживается или нет? И вот, спустя много месяцев кропотливого сбора грязных (во всех смыслах этого слова) данных, у меня появился ответ.

Если вам тоже интересно узнать, как при помощи байесовских методов можно отвечать на такие важные жизненные вопросы, то добро пожаловать по ссылке: Dog Poop Compass

P.S. Статью опубликовали в TowardsDataScience! И теперь на меня еще можно подписаться и читать на английском на Substack.
5420👍3💩22😁1
Data Wondering
Dog Poop Compass: Bayesian Analysis of Canine Business #DataWondering Как и многие владельцы собак, во время прогулок с Аури я всё время наблюдаю один и тот же ритуал. Перед тем, как приняться за пёсьи дела, он каждый раз много-много раз крутится вокруг своей…
Никогда бы не подумал, что нужно написать про собачьи экскременты, чтобы попасть в Towards Data Science.
Качественный шитпостинг 💩
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6😁53
Сегодня я в очередной раз сделал виток вокруг солнца и по этому поводу наконец-то добрался до визуализации, которую давно хотел сделать.

🪐 При помощи прекрасной библиотеки Skyfield я достал координаты планет солнечной системы с момента моего рождения до сегодняшнего дня и засунул всё это в гифки. Парада планет не вышло, но получилось красиво и залипательно. Сатурн как раз успел сделать полный виток.

🪐 Если хочется повторить такое же для себя, то вот ссылка на код: [тык тык]

📈А лучшим подарком для меня будет репост этого канала, потому что watching the numbers go up ведёт к neuron activation :)

#DataViz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥7