Data Wondering
Photo
Не-итоги 2024
Итоги года я всегда подводил не публично и даже если писал какие-то заметки, они оставались только со мной. В этом году у меня появился этот, пока еще небольшой, канал, так что впервые решил что-то опубликовать. И традиционно напрокрастинировал настолько, что под конец года написал только план.
Поэтому в то время как мой пёс заливается лаем от салютов и фейерверков, которые в Финляндии разрешено запускать ровно один раз в году — с 6 вечера 31 декабря до 2 утра 1 января, я волевым решением отложил на завтра то, что не успел написать сегодня.
Итоги будут окончательно готовы уже в следующем году, а сейчас делюсь финальной статистикой по каналу. Результаты пока скромные, ноthe real treasure was the friends we made along the way . Так что большое спасибо всем подписавшимся и читающим, мне очень приятно, что вы здесь ❤️
C наступающим Новым Годом! Пусть он будет мирным🎄
Итоги года я всегда подводил не публично и даже если писал какие-то заметки, они оставались только со мной. В этом году у меня появился этот, пока еще небольшой, канал, так что впервые решил что-то опубликовать. И традиционно напрокрастинировал настолько, что под конец года написал только план.
Поэтому в то время как мой пёс заливается лаем от салютов и фейерверков, которые в Финляндии разрешено запускать ровно один раз в году — с 6 вечера 31 декабря до 2 утра 1 января, я волевым решением отложил на завтра то, что не успел написать сегодня.
Итоги будут окончательно готовы уже в следующем году, а сейчас делюсь финальной статистикой по каналу. Результаты пока скромные, но
C наступающим Новым Годом! Пусть он будет мирным
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥4
Первая пятница нового года, время для несвежих мемов. Делитесь своими лучшими находками в комментах
#memes
#memes
Небольшой тизер очередного пет-проекта.
▫️Последние полтора месяца активно игрался с локальными LLM: запускал дистиллированные версии на разных по мощности устройствах, настраивал structured output с prompt chaining и пытался заставить их нормально работать.
▫️А всё ради того, чтобы распарсить тексты из Википедии и построить красивые графики по всем историческим битвам и войнам человечества.
▫️Несколько примеров — количество битв за каждый год начиная от третьего тысячелетия до нашей эры и по сегодняшний день. На первом графике — общий таймлайн, на втором — срез с 1500 года и, наконец, такой же срез, но нормированный на мировое население — на третьем.
▫️Выводы, код и промпты, оценки сил сторон, красивые карты с указанием, откуда готовилось нападение и всё такое прочее опишу уже позже в статье. А пока можно позалипать и поискать своим monkey pattern-seeking brain циклы и зависимости там, где их может и не быть.
▫️Последние полтора месяца активно игрался с локальными LLM: запускал дистиллированные версии на разных по мощности устройствах, настраивал structured output с prompt chaining и пытался заставить их нормально работать.
▫️А всё ради того, чтобы распарсить тексты из Википедии и построить красивые графики по всем историческим битвам и войнам человечества.
▫️Несколько примеров — количество битв за каждый год начиная от третьего тысячелетия до нашей эры и по сегодняшний день. На первом графике — общий таймлайн, на втором — срез с 1500 года и, наконец, такой же срез, но нормированный на мировое население — на третьем.
▫️Выводы, код и промпты, оценки сил сторон, красивые карты с указанием, откуда готовилось нападение и всё такое прочее опишу уже позже в статье. А пока можно позалипать и поискать своим monkey pattern-seeking brain циклы и зависимости там, где их может и не быть.
❤🔥10❤3
Defense Against Dishonest Charts 📈
#DataViz
Вдогонку ко вчерашним визуализациям — нашел совершенно очаровательный сайт, в котором можно интерактивно подергать всякие настройки графиков и лично убедиться в том, насколько легко можно врать при помощи статистики.
Моя любимая категория — Base Stealer, насобирал уже отдельную коллекцию примеров таких графиков, в том числе из своей родной конторы.
#DataViz
Вдогонку ко вчерашним визуализациям — нашел совершенно очаровательный сайт, в котором можно интерактивно подергать всякие настройки графиков и лично убедиться в том, насколько легко можно врать при помощи статистики.
Моя любимая категория — Base Stealer, насобирал уже отдельную коллекцию примеров таких графиков, в том числе из своей родной конторы.
With a complete disregard for how charts work, the base stealer shortens the y-axis on a bar chart from the bottom. This forces focus on the tops of the bars, which incorrectly makes tiny differences seem significant.
Please open Telegram to view this post
VIEW IN TELEGRAM
FlowingData
Defense Against Dishonest Charts
This is a guide to protect ourselves and to preserve what is good about turning data into visual things.
❤🔥8👍1
Уже совсем скоро буду рассказывать про самое интересное на стыке HealthTech, FemTech и AI, приходите 😌
#HealthTech
#HealthTech
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥3
Forwarded from Femtech Force — новости, вакансии, подкаст
Спикеры конференции Femtech Force Jam: Дмитрий Сергеев
Продолжаем знакомить вас со спикерами первой русскоязычной фемтех-конференции, которая пройдет 12 марта онлайн
💥 Дмитрий Сергеев руководит европейской Data Science командой в компании ŌURA, выпускающей умные кольца.
Помимо этого, Дмитрий занимался внедрением машинного обучения в различных HealthTech стартапах, работал Head of Data Science в компании WeatherWell, изучающей влияние климата и погоды на здоровье человека.
Автор телеграм-канала @data_wondering
Во время Femtech Force Jam Дмитрий выступит с темой «Носимые устройства, цифровые биомаркеры и FemTech» и расскажет:
— Что такое цифровые биомаркеры: как они измеряются и какие задачи помогают решать?
— Самое интересное на рынке: как носимые устройства уже облегчают жизнь?
— Будущее носимых устройств: здравоохранение, гиперперсонализация, и при чем тут AI?
💥 Femtech Force Jam — это первая русскоязычная фемтех-конференция, организованная Femtech Force. Вместе с экспертами из Flo Health, Oura, Diagnio, Clatch и других компаний обсудим настоящее и будущее технологий в сфере женского здоровья
Дата: 12 марта 2025, 14:00–19:00 CET (16:00–21:00 МСК) ОНЛАЙН
Участие: бесплатное синхронное, записи будут доступны за донейшн
➡️ Регистрация
@FemtechForce — о технологиях для здоровья женщин
Продолжаем знакомить вас со спикерами первой русскоязычной фемтех-конференции, которая пройдет 12 марта онлайн
Помимо этого, Дмитрий занимался внедрением машинного обучения в различных HealthTech стартапах, работал Head of Data Science в компании WeatherWell, изучающей влияние климата и погоды на здоровье человека.
Преподавал в ЦМФ МГУ, ФНК ВШЭ, Aalto University. Руководил программами и читал лекции на различных онлайн курсах и платформах, таких как OTUS, ODS.ai и др
Автор телеграм-канала @data_wondering
Во время Femtech Force Jam Дмитрий выступит с темой «Носимые устройства, цифровые биомаркеры и FemTech» и расскажет:
— Что такое цифровые биомаркеры: как они измеряются и какие задачи помогают решать?
— Самое интересное на рынке: как носимые устройства уже облегчают жизнь?
— Будущее носимых устройств: здравоохранение, гиперперсонализация, и при чем тут AI?
Дата: 12 марта 2025, 14:00–19:00 CET (16:00–21:00 МСК) ОНЛАЙН
Участие: бесплатное синхронное, записи будут доступны за донейшн
@FemtechForce — о технологиях для здоровья женщин
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12🔥6👍3
Немного рекламы: вакансия в ŌURA
Ищу к себе в команду Middle/Senior Data Scientist-а на запуск нового направления — анализ и предиктивное моделирование умного кольца и его физических компонент.
Это возможность напрямую поработать с данными от наших фабрик и поставщиков чтобы оптимизировать процессы производства и построить системы для предсказания потенциальных проблем. Будет интересно: много данных, хорошие процессы и польза для человечества :)
К сожалению, без релокации, так что релевантно только для тех, кто уже в Финляндии (Оулу или Хельсинки) или в процессе переезда. Если интересно и вам подходит, напишите мне @dmitryserg
Буду также благодарен репостам и рекомендациям!
https://apply.workable.com/oura-health-ltd/j/48037A030E/
Ищу к себе в команду Middle/Senior Data Scientist-а на запуск нового направления — анализ и предиктивное моделирование умного кольца и его физических компонент.
Это возможность напрямую поработать с данными от наших фабрик и поставщиков чтобы оптимизировать процессы производства и построить системы для предсказания потенциальных проблем. Будет интересно: много данных, хорошие процессы и польза для человечества :)
К сожалению, без релокации, так что релевантно только для тех, кто уже в Финляндии (Оулу или Хельсинки) или в процессе переезда. Если интересно и вам подходит, напишите мне @dmitryserg
Буду также благодарен репостам и рекомендациям!
https://apply.workable.com/oura-health-ltd/j/48037A030E/
Workable
Oura
Oura is a growth company where cutting edge hardware, software and data expertise is brought together to deliver a reliable and lovable product designed with our users. With us, you get to work on Your passion with talented and collaborative colleagues.
❤14
AWS Innovate: Generative AI + Data
6 марта пройдет бесплатная конференция от AWS, полностью посвященная Gen AI.
Обычно, AWS Innovate — это не самое полезное времяпровождение и ребятки просто рассказывают по документациям, какие возможности есть у AWS и как можно сделать Джеффри Безоса еще богаче. Но в этот раз есть несколько очень прикладных треков, может быть интересно
6 марта пройдет бесплатная конференция от AWS, полностью посвященная Gen AI.
Обычно, AWS Innovate — это не самое полезное времяпровождение и ребятки просто рассказывают по документациям, какие возможности есть у AWS и как можно сделать Джеффри Безоса еще богаче. Но в этот раз есть несколько очень прикладных треков, может быть интересно
Amazon
AWS Innovate - Generative AI and Data
Join us at Innovate to discover how AWS can help you harness the full potential of generative AI and data.
❤4😁1
Испытал сегодня новые ощущения, пока собеседовал кандидата на Senior Data Science позицию. Очень простой технический собес, буквально взять игрушечный датасет и пройтись по основным этапам построения модели: от EDA до Evaluation, попутно поясняя свои шаги.
Беседа началась, не предвещая беды. Будущий дата сайентист уверенно написал print(X.head()), перезапустив kernel всего три раза. Каждый следующий этап сопровождался минимум двухминутной паузой. Особенно ненавязчиво это проявлялось после моих вопросов на уровне “а зачем нам нужен train_test_split?” или “а зачем здесь добавлено stratify=y?”. Человек отвечал, что и сам не понял, зачем это нужно, потом выпадал на некоторое время, после чего выдавал блестящий ответ.
По итогам разговора могу точно сказать, что ChatGPT прошел тест Тьюринга. Про кандидата того же сказать не могу. Ощущения от проведения интервью для LLM с кожаным мешком в качестве прокси действительно новые.
Был ли у вас такой опыт собеседований?
Беседа началась, не предвещая беды. Будущий дата сайентист уверенно написал print(X.head()), перезапустив kernel всего три раза. Каждый следующий этап сопровождался минимум двухминутной паузой. Особенно ненавязчиво это проявлялось после моих вопросов на уровне “а зачем нам нужен train_test_split?” или “а зачем здесь добавлено stratify=y?”. Человек отвечал, что и сам не понял, зачем это нужно, потом выпадал на некоторое время, после чего выдавал блестящий ответ.
По итогам разговора могу точно сказать, что ChatGPT прошел тест Тьюринга. Про кандидата того же сказать не могу. Ощущения от проведения интервью для LLM с кожаным мешком в качестве прокси действительно новые.
Был ли у вас такой опыт собеседований?
😁24