Data Wondering

Не-итоги 2024

Итоги года я всегда подводил не публично и даже если писал какие-то заметки, они оставались только со мной. В этом году у меня появился этот, пока еще небольшой, канал, так что впервые решил что-то опубликовать. И традиционно напрокрастинировал настолько, что под конец года написал только план.

Поэтому в то время как мой пёс заливается лаем от салютов и фейерверков, которые в Финляндии разрешено запускать ровно один раз в году — с 6 вечера 31 декабря до 2 утра 1 января, я волевым решением отложил на завтра то, что не успел написать сегодня.

Итоги будут окончательно готовы уже в следующем году, а сейчас делюсь финальной статистикой по каналу. Результаты пока скромные, но the real treasure was the friends we made along the way. Так что большое спасибо всем подписавшимся и читающим, мне очень приятно, что вы здесь ❤️

C наступающим Новым Годом! Пусть он будет мирным 🎄

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15🔥4

538 viewsedited 17:41

Data Wondering

Первая пятница нового года, время для несвежих мемов. Делитесь своими лучшими находками в комментах
#memes

7❤3😁3

616 views20:20

Data Wondering

Небольшой тизер очередного пет-проекта.

▫️Последние полтора месяца активно игрался с локальными LLM: запускал дистиллированные версии на разных по мощности устройствах, настраивал structured output с prompt chaining и пытался заставить их нормально работать.

▫️А всё ради того, чтобы распарсить тексты из Википедии и построить красивые графики по всем историческим битвам и войнам человечества.

▫️Несколько примеров — количество битв за каждый год начиная от третьего тысячелетия до нашей эры и по сегодняшний день. На первом графике — общий таймлайн, на втором — срез с 1500 года и, наконец, такой же срез, но нормированный на мировое население — на третьем.

▫️Выводы, код и промпты, оценки сил сторон, красивые карты с указанием, откуда готовилось нападение и всё такое прочее опишу уже позже в статье. А пока можно позалипать и поискать своим monkey pattern-seeking brain циклы и зависимости там, где их может и не быть.

❤‍🔥10❤3

637 views18:00

Data Wondering

Defense Against Dishonest Charts

📈

#DataViz

Вдогонку ко вчерашним визуализациям — нашел совершенно очаровательный сайт, в котором можно интерактивно подергать всякие настройки графиков и лично убедиться в том, насколько легко можно врать при помощи статистики.

Моя любимая категория — Base Stealer, насобирал уже отдельную коллекцию примеров таких графиков, в том числе из своей родной конторы.

With a complete disregard for how charts work, the base stealer shortens the y-axis on a bar chart from the bottom. This forces focus on the tops of the bars, which incorrectly makes tiny differences seem significant.

Please open Telegram to view this post

VIEW IN TELEGRAM

FlowingData

Defense Against Dishonest Charts

This is a guide to protect ourselves and to preserve what is good about turning data into visual things.

❤‍🔥8👍1

905 views15:00

Data Wondering

Уже совсем скоро буду рассказывать про самое интересное на стыке HealthTech, FemTech и AI, приходите 😌
#HealthTech

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥3

437 views11:10

Data Wondering

Forwarded from Femtech Force — новости, вакансии, подкаст

Спикеры конференции Femtech Force Jam: Дмитрий Сергеев

Продолжаем знакомить вас со спикерами первой русскоязычной фемтех-конференции, которая пройдет 12 марта онлайн

💥

Дмитрий Сергеев руководит европейской Data Science командой в компании ŌURA, выпускающей умные кольца.

Помимо этого, Дмитрий занимался внедрением машинного обучения в различных HealthTech стартапах, работал Head of Data Science в компании WeatherWell, изучающей влияние климата и погоды на здоровье человека.

Преподавал в ЦМФ МГУ, ФНК ВШЭ, Aalto University. Руководил программами и читал лекции на различных онлайн курсах и платформах, таких как OTUS, ODS.ai и др

Автор телеграм-канала @data_wondering

Во время Femtech Force Jam Дмитрий выступит с темой «Носимые устройства, цифровые биомаркеры и FemTech» и расскажет:

— Что такое цифровые биомаркеры: как они измеряются и какие задачи помогают решать?
— Самое интересное на рынке: как носимые устройства уже облегчают жизнь?
— Будущее носимых устройств: здравоохранение, гиперперсонализация, и при чем тут AI?

💥

Femtech Force Jam — это первая русскоязычная фемтех-конференция, организованная Femtech Force. Вместе с экспертами из Flo Health, Oura, Diagnio, Clatch и других компаний обсудим настоящее и будущее технологий в сфере женского здоровья

Дата: 12 марта 2025, 14:00–19:00 CET (16:00–21:00 МСК) ОНЛАЙН
Участие: бесплатное синхронное, записи будут доступны за донейшн

➡️

Регистрация

@FemtechForce — о технологиях для здоровья женщин

Please open Telegram to view this post

VIEW IN TELEGRAM

❤12🔥6👍3

560 views11:10

Data Wondering

Немного рекламы: вакансия в ŌURA

Ищу к себе в команду Middle/Senior Data Scientist-а на запуск нового направления — анализ и предиктивное моделирование умного кольца и его физических компонент.

Это возможность напрямую поработать с данными от наших фабрик и поставщиков чтобы оптимизировать процессы производства и построить системы для предсказания потенциальных проблем. Будет интересно: много данных, хорошие процессы и польза для человечества :)

К сожалению, без релокации, так что релевантно только для тех, кто уже в Финляндии (Оулу или Хельсинки) или в процессе переезда. Если интересно и вам подходит, напишите мне @dmitryserg

Буду также благодарен репостам и рекомендациям!

https://apply.workable.com/oura-health-ltd/j/48037A030E/

Workable

Oura

Oura is a growth company where cutting edge hardware, software and data expertise is brought together to deliver a reliable and lovable product designed with our users. With us, you get to work on Your passion with talented and collaborative colleagues.

❤14

732 views19:30

Data Wondering

AWS Innovate: Generative AI + Data

6 марта пройдет бесплатная конференция от AWS, полностью посвященная Gen AI.

Обычно, AWS Innovate — это не самое полезное времяпровождение и ребятки просто рассказывают по документациям, какие возможности есть у AWS и как можно сделать Джеффри Безоса еще богаче. Но в этот раз есть несколько очень прикладных треков, может быть интересно

Amazon

AWS Innovate - Generative AI and Data

Join us at Innovate to discover how AWS can help you harness the full potential of generative AI and data.

❤4😁1

666 views10:05

Data Wondering

Испытал сегодня новые ощущения, пока собеседовал кандидата на Senior Data Science позицию. Очень простой технический собес, буквально взять игрушечный датасет и пройтись по основным этапам построения модели: от EDA до Evaluation, попутно поясняя свои шаги.

Беседа началась, не предвещая беды. Будущий дата сайентист уверенно написал print(X.head()), перезапустив kernel всего три раза. Каждый следующий этап сопровождался минимум двухминутной паузой. Особенно ненавязчиво это проявлялось после моих вопросов на уровне “а зачем нам нужен train_test_split?” или “а зачем здесь добавлено stratify=y?”. Человек отвечал, что и сам не понял, зачем это нужно, потом выпадал на некоторое время, после чего выдавал блестящий ответ.

По итогам разговора могу точно сказать, что ChatGPT прошел тест Тьюринга. Про кандидата того же сказать не могу. Ощущения от проведения интервью для LLM с кожаным мешком в качестве прокси действительно новые.

Был ли у вас такой опыт собеседований?

😁24

528 views19:15

About

Blog

Apps

Platform