Data Wondering
444 subscribers
49 photos
3 videos
44 links
A place where curiosity meets data. AI / DS / ML / HealthTech
Boost link: https://t.iss.one/data_wondering?boost
By @dmitryserg
Download Telegram
Data Wondering
Dog Poop Compass: Bayesian Analysis of Canine Business #DataWondering Как и многие владельцы собак, во время прогулок с Аури я всё время наблюдаю один и тот же ритуал. Перед тем, как приняться за пёсьи дела, он каждый раз много-много раз крутится вокруг своей…
Никогда бы не подумал, что нужно написать про собачьи экскременты, чтобы попасть в Towards Data Science.
Качественный шитпостинг 💩
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6😁53
Сегодня я в очередной раз сделал виток вокруг солнца и по этому поводу наконец-то добрался до визуализации, которую давно хотел сделать.

🪐 При помощи прекрасной библиотеки Skyfield я достал координаты планет солнечной системы с момента моего рождения до сегодняшнего дня и засунул всё это в гифки. Парада планет не вышло, но получилось красиво и залипательно. Сатурн как раз успел сделать полный виток.

🪐 Если хочется повторить такое же для себя, то вот ссылка на код: [тык тык]

📈А лучшим подарком для меня будет репост этого канала, потому что watching the numbers go up ведёт к neuron activation :)

#DataViz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥7
Про умные кольца
#ŌURA #HealthTech #SmartRings

💍 Не смог пройти мимо такой внезапной новости — Сбер решил выпустить своё умное кольцо, которое, на первый взгляд, очень напоминает кольцо предыдущего поколения другой небезызвестной компании. Начиная от дизайна и расположения сенсоров и заканчивая фичами и метриками. Только вместо нашего Readiness Score, у Сбера будет Ресурс, а вместо Activity Score, Индекс Активности. Совпадение? Не думаю.

💤 Обещают основные вещи, вроде анализа сна, физической активности, мониторинга стресса + базовые датчики, позволяющие измерять HR/HRV/SpO2. При этом не нашел информации про автоматическое распознание активности, только про измерение нагрузки.

🤖 Пока что доступен только предзаказ и никаких подробностей про качество работы алгоритмов или хотя бы сриншотов приложения нету, но было бы очень интересно узнать и пощупать. Сбор данных для обучения делали при помощи полисомнографии от клиники Медси и собрали “более сотни” наблюдений, что довольно неплохо, учитывая стоимость и сложность проведения таких исследований. Но, для сравнения, в Оуре выборки такого размера собирались просто для независимой валидации алгоритмов, а обучение проводили на гораздо бОльших объемах.

😎 Большой упор явно делается на интеграцию GigaChat, который должен будет “раскрывать ключевые показатели организма и давать персональные рекомендации”. Обещают, что он даже “помогает вырабатывать здоровые привычки, которые останутся с вами надолго”. Интересно, насколько будет похоже на наш Advisor.
Надеюсь, что кольцо — это не просто способ рекламы гигачата, как было с кольцом от Samsung, которое выпустили как будто только ради пиара Samsung AI.

😌 Из немного курьёзного — среди сенсоров и датчиков отдельно гордо указан Bluetooth-модуль :)

Ну и моя любимая часть:

Наши алгоритмы обучены на данных российских пользователей, что позволяет учитывать локальную специфику и давать более точные и релевантные рекомендации


Очень, очень хочу узнать, что же такого особенного у российских пользователей, что у них и сердца бьются по-другому, и сон не такой, как у всех, и нужно обязательно учитывать эту локальную специфику при обучении алгоритмов :)

Ну а если серьезно, если кольцо действительно будет работать и ребятки особо не воровали патенты и IP, то команда SberDevices большие молодцы. Выглядит намного круче, чем то же кольцо от Самсунга. Попробую заполучить себе на тест-драйв.
P.S. Если меня читают люди из SberDevices — поделитесь early access? 😄

@data_wondering
Please open Telegram to view this post
VIEW IN TELEGRAM
42
Pokemon Go: A wild Big Brother appears
#AISafety

Шикарная новость, о которой я узнал только сегодня. Компания Niantic, известная по игре Pokemon Go, рассказала, как она использует фотографии, сделанные игроками, для тренировки своей Large Geospatial Model (LGM).

The LGM will enable computers not only to perceive and understand physical spaces, but also to interact with them in new ways, forming a critical component of AR glasses and fields beyond, including robotics, content creation and autonomous systems. 


Звучит хорошо, но, как обычно, это не та информация, которую можно найти на первой строчке пользовательского соглашения. Так что бОльшая часть игроков делает фотографии (в том числе частных помещений), не подозревая о последствиях.

Дальше еще интереснее. Компания уже пять лет строит еще одну систему:

Over the past five years, Niantic has focused on building our Visual Positioning System (VPS), which uses a single image from a phone to determine its position and orientation using a 3D map built from people scanning interesting locations in our games


И вишенка на торте:

With VPS, users can position themselves in the world with centimeter-level accuracy.


Нормальный такой скачок от ловли и тренировки покемонов до позиционирования на 3D карте с точностью до сантиметра по одной единственной фотографии.

Today we have 10 million scanned locations around the world, and over 1 million of those are activated and available for use with our VPS service.


Несложно представить, как такая модель может использоваться в военных целях для высокоточного и автономного распространения демократии. Достаточно одной фотографии в локации, попавшей в выборку из 10 миллионов отсканированных мест, и моделька сможет определить местоположение в десятки раз точнее, чем GPS.

Ну а если какого-то места еще нет в выборке, достаточно открыть там Pokemon Training Center или закинуть редкого покемона, а игроки уже всё доделают 🥂

We receive about 1 million fresh scans each week, each containing hundreds of discrete images. 

Опять черное зеркало перепутали с руководством к действию. С кем не бывает.

@data_wondering
Please open Telegram to view this post
VIEW IN TELEGRAM
👍721
Finally, a Replacement for BERT

Создатели оригинального BERT (2018) выпустили обновление своего прекрасного и любимого многими энкодера: ModernBERT. Работает быстрее, точнее, и с бОльшей длиной последовательности.

ModernBERT is the only model which is a top scorer across every category, which makes it the one model you can use for all your encoder-based tasks


Попробую пощупать новые эмбеддинги, осталось только найти для них интересную задачку 🏃
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Рекомендация

Один из моих любимых ютьюберов, Sam O’Nella Academy, который выпускает примерно по половине видео в год (максимальный quality over quantity), выложил шикарное ревью на “Естественную Историю” Плиния Старшего. Полностью “Историю” от одного из первых в мире энциклопедистов я еще не читал, но после видео очень захотелось.

Это отличный срез знаний, доступных римской цивилизации к 77 году нашей эры, обильно сдобренный домыслами самого Плиния. На случай, если вы сегодня еще не думали о римской империи — это ваш шанс.

Для меня самое удивительное — это постоянные колебания между неожиданно точным научным подходом и рандомными выдумками с аргументацией в лучших традициях “it was revealed to me in a dream”.

Из коммента под видео:
A lot of Pliny's observations range from "proving the earth is round by observing stars over the horizon" to "some farmer in India told me that there's a rock that kills anything that touches it"


Ну и, конечно, куда же без HealthTech-а. Вот state-of-the-art человеческих знаний насчет менструаций, circa 77 AD (colorized):

Но нелег­ко обна­ру­жить что-то более стран­ное, чем мен­стру­а­ции жен­щин. Когда они в таком состо­я­нии близ­ко под­хо­дят к моло­до­му вину, оно киснет, зер­но­вые куль­ту­ры вслед­ст­вие их при­кос­но­ве­ния пере­ста­ют пло­до­но­сить, при­вои поги­ба­ют, рост­ки в садах засы­ха­ют, пло­ды дере­вьев, под кото­ры­ми они посиде­ли, осы­па­ют­ся, блеск зер­кал от одно­го их взгляда туск­не­ет, ору­жие при­туп­ля­ет­ся, сло­но­вая кость теря­ет свою пре­лесть, пче­ли­ные улья гиб­нут, даже медь и желе­зо тот­час ржа­ве­ют и при­об­ре­та­ют зло­вон­ный запах, и соба­ки, поли­зав их, впа­да­ют в бешен­ство, а укус их про­пи­ты­ва­ет­ся неис­це­ли­мым ядом.

Хорошо, что текущее понимание стало чуть-чуть получше. Хотя до сих пор в медицине (да и во всех других научных сферах) сохраняется огромный knowledge gap между пониманием мужской и женской биологии. Отличная книга на эту тему: Invisible Women: Data Bias in a World Designed for Men

P.S. у Sam O’Nella есть прекрасное эссе о не самых известных персонажах рождественского фольклора — идеально послушать на праздниках 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥31
Data Wondering
Photo
Не-итоги 2024

Итоги года я всегда подводил не публично и даже если писал какие-то заметки, они оставались только со мной. В этом году у меня появился этот, пока еще небольшой, канал, так что впервые решил что-то опубликовать. И традиционно напрокрастинировал настолько, что под конец года написал только план.

Поэтому в то время как мой пёс заливается лаем от салютов и фейерверков, которые в Финляндии разрешено запускать ровно один раз в году — с 6 вечера 31 декабря до 2 утра 1 января, я волевым решением отложил на завтра то, что не успел написать сегодня.

Итоги будут окончательно готовы уже в следующем году, а сейчас делюсь финальной статистикой по каналу. Результаты пока скромные, но the real treasure was the friends we made along the way. Так что большое спасибо всем подписавшимся и читающим, мне очень приятно, что вы здесь ❤️

C наступающим Новым Годом! Пусть он будет мирным 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥4
Первая пятница нового года, время для несвежих мемов. Делитесь своими лучшими находками в комментах
#memes
73😁3