Data Wondering
445 subscribers
49 photos
3 videos
44 links
A place where curiosity meets data. AI / DS / ML / HealthTech
Boost link: https://t.iss.one/data_wondering?boost
By @dmitryserg
Download Telegram
Пятничная подборка качественного контента 🥂
#memes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8
Открытая лекция
#OTUS

Сегодня снова в 20:00 по Москве проведу открытый урок [тык]. На этот раз будем говорить про карьерные пути в этом нашем дата сайенсе и что должен делать тимлид для развития своей команды.

Ссылку на трансляцию закину в комментарии за 5 минут до начала :)
9
📲 Рекомендация — если вам интересно попробовать себя в AI Safety и вы считаете, что у кожаных мешков всё ещё есть шанс, то есть отличная возможность, с которой может помочь мой друг Вася. Далее текст от него:

🎓 Стипендиальная программа Impact Academy для технических исследователей безопасности ИИ


Мы — сообщество Unitaware. Ищем амбициозных и талантливых людей в области ML/AI для участия в стипендиальной программе Impact Academy по безопасности ИИ. Это шанс проводить исследования и работать с лидерами индустрии — и получить от них приглашения в топовые AI safety лабы и проекты (например, Center for Human-Compatible Artificial Intelligence, FAR AI и Mila AI Institute)

💼 Что вас ждет?

• Оффлайн программа (3-6 месяцев с марта) в Сингапуре, Англии или США.
• Исследования и коучинг в сфере AI safety.
• Стипендия ~$5000/мес.
• Перспектива работы в ведущих AI-проектах.

👤 Кого мы ищем?

• Отличный английский и опыт в ML/DL (публикации, стажировки, проекты).
• Программирование на уровне ведущей техкомпании.
• Достижения: олимпиады или учеба на топовых кафедрах.
• Интерес к снижению рисков от продвинутых AI-систем.

Срок подачи: до 31 декабря (лучше до первой недели декабря).

Если заинтересовались или знаете подходящего кандидата, напишите @vakondyrev, это максимизирует шансы при прочих равных. За рекомендацию подходящего кандидата также предусмотрено вознаграждение
Please open Telegram to view this post
VIEW IN TELEGRAM
141
Dog Poop Compass: Bayesian Analysis of Canine Business
#DataWondering

Как и многие владельцы собак, во время прогулок с Аури я всё время наблюдаю один и тот же ритуал. Перед тем, как приняться за пёсьи дела, он каждый раз много-много раз крутится вокруг своей оси, пока не выстроится поудобнее.

В один прекрасный момент я начал делать скриншоты компаса, чтобы когда-нибудь оценить, а рандомно ли собака усаживается или нет? И вот, спустя много месяцев кропотливого сбора грязных (во всех смыслах этого слова) данных, у меня появился ответ.

Если вам тоже интересно узнать, как при помощи байесовских методов можно отвечать на такие важные жизненные вопросы, то добро пожаловать по ссылке: Dog Poop Compass

P.S. Статью опубликовали в TowardsDataScience! И теперь на меня еще можно подписаться и читать на английском на Substack.
5420👍3💩22😁1
Data Wondering
Dog Poop Compass: Bayesian Analysis of Canine Business #DataWondering Как и многие владельцы собак, во время прогулок с Аури я всё время наблюдаю один и тот же ритуал. Перед тем, как приняться за пёсьи дела, он каждый раз много-много раз крутится вокруг своей…
Никогда бы не подумал, что нужно написать про собачьи экскременты, чтобы попасть в Towards Data Science.
Качественный шитпостинг 💩
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6😁53
Сегодня я в очередной раз сделал виток вокруг солнца и по этому поводу наконец-то добрался до визуализации, которую давно хотел сделать.

🪐 При помощи прекрасной библиотеки Skyfield я достал координаты планет солнечной системы с момента моего рождения до сегодняшнего дня и засунул всё это в гифки. Парада планет не вышло, но получилось красиво и залипательно. Сатурн как раз успел сделать полный виток.

🪐 Если хочется повторить такое же для себя, то вот ссылка на код: [тык тык]

📈А лучшим подарком для меня будет репост этого канала, потому что watching the numbers go up ведёт к neuron activation :)

#DataViz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥7
Про умные кольца
#ŌURA #HealthTech #SmartRings

💍 Не смог пройти мимо такой внезапной новости — Сбер решил выпустить своё умное кольцо, которое, на первый взгляд, очень напоминает кольцо предыдущего поколения другой небезызвестной компании. Начиная от дизайна и расположения сенсоров и заканчивая фичами и метриками. Только вместо нашего Readiness Score, у Сбера будет Ресурс, а вместо Activity Score, Индекс Активности. Совпадение? Не думаю.

💤 Обещают основные вещи, вроде анализа сна, физической активности, мониторинга стресса + базовые датчики, позволяющие измерять HR/HRV/SpO2. При этом не нашел информации про автоматическое распознание активности, только про измерение нагрузки.

🤖 Пока что доступен только предзаказ и никаких подробностей про качество работы алгоритмов или хотя бы сриншотов приложения нету, но было бы очень интересно узнать и пощупать. Сбор данных для обучения делали при помощи полисомнографии от клиники Медси и собрали “более сотни” наблюдений, что довольно неплохо, учитывая стоимость и сложность проведения таких исследований. Но, для сравнения, в Оуре выборки такого размера собирались просто для независимой валидации алгоритмов, а обучение проводили на гораздо бОльших объемах.

😎 Большой упор явно делается на интеграцию GigaChat, который должен будет “раскрывать ключевые показатели организма и давать персональные рекомендации”. Обещают, что он даже “помогает вырабатывать здоровые привычки, которые останутся с вами надолго”. Интересно, насколько будет похоже на наш Advisor.
Надеюсь, что кольцо — это не просто способ рекламы гигачата, как было с кольцом от Samsung, которое выпустили как будто только ради пиара Samsung AI.

😌 Из немного курьёзного — среди сенсоров и датчиков отдельно гордо указан Bluetooth-модуль :)

Ну и моя любимая часть:

Наши алгоритмы обучены на данных российских пользователей, что позволяет учитывать локальную специфику и давать более точные и релевантные рекомендации


Очень, очень хочу узнать, что же такого особенного у российских пользователей, что у них и сердца бьются по-другому, и сон не такой, как у всех, и нужно обязательно учитывать эту локальную специфику при обучении алгоритмов :)

Ну а если серьезно, если кольцо действительно будет работать и ребятки особо не воровали патенты и IP, то команда SberDevices большие молодцы. Выглядит намного круче, чем то же кольцо от Самсунга. Попробую заполучить себе на тест-драйв.
P.S. Если меня читают люди из SberDevices — поделитесь early access? 😄

@data_wondering
Please open Telegram to view this post
VIEW IN TELEGRAM
42
Pokemon Go: A wild Big Brother appears
#AISafety

Шикарная новость, о которой я узнал только сегодня. Компания Niantic, известная по игре Pokemon Go, рассказала, как она использует фотографии, сделанные игроками, для тренировки своей Large Geospatial Model (LGM).

The LGM will enable computers not only to perceive and understand physical spaces, but also to interact with them in new ways, forming a critical component of AR glasses and fields beyond, including robotics, content creation and autonomous systems. 


Звучит хорошо, но, как обычно, это не та информация, которую можно найти на первой строчке пользовательского соглашения. Так что бОльшая часть игроков делает фотографии (в том числе частных помещений), не подозревая о последствиях.

Дальше еще интереснее. Компания уже пять лет строит еще одну систему:

Over the past five years, Niantic has focused on building our Visual Positioning System (VPS), which uses a single image from a phone to determine its position and orientation using a 3D map built from people scanning interesting locations in our games


И вишенка на торте:

With VPS, users can position themselves in the world with centimeter-level accuracy.


Нормальный такой скачок от ловли и тренировки покемонов до позиционирования на 3D карте с точностью до сантиметра по одной единственной фотографии.

Today we have 10 million scanned locations around the world, and over 1 million of those are activated and available for use with our VPS service.


Несложно представить, как такая модель может использоваться в военных целях для высокоточного и автономного распространения демократии. Достаточно одной фотографии в локации, попавшей в выборку из 10 миллионов отсканированных мест, и моделька сможет определить местоположение в десятки раз точнее, чем GPS.

Ну а если какого-то места еще нет в выборке, достаточно открыть там Pokemon Training Center или закинуть редкого покемона, а игроки уже всё доделают 🥂

We receive about 1 million fresh scans each week, each containing hundreds of discrete images. 

Опять черное зеркало перепутали с руководством к действию. С кем не бывает.

@data_wondering
Please open Telegram to view this post
VIEW IN TELEGRAM
👍721
Finally, a Replacement for BERT

Создатели оригинального BERT (2018) выпустили обновление своего прекрасного и любимого многими энкодера: ModernBERT. Работает быстрее, точнее, и с бОльшей длиной последовательности.

ModernBERT is the only model which is a top scorer across every category, which makes it the one model you can use for all your encoder-based tasks


Попробую пощупать новые эмбеддинги, осталось только найти для них интересную задачку 🏃
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Рекомендация

Один из моих любимых ютьюберов, Sam O’Nella Academy, который выпускает примерно по половине видео в год (максимальный quality over quantity), выложил шикарное ревью на “Естественную Историю” Плиния Старшего. Полностью “Историю” от одного из первых в мире энциклопедистов я еще не читал, но после видео очень захотелось.

Это отличный срез знаний, доступных римской цивилизации к 77 году нашей эры, обильно сдобренный домыслами самого Плиния. На случай, если вы сегодня еще не думали о римской империи — это ваш шанс.

Для меня самое удивительное — это постоянные колебания между неожиданно точным научным подходом и рандомными выдумками с аргументацией в лучших традициях “it was revealed to me in a dream”.

Из коммента под видео:
A lot of Pliny's observations range from "proving the earth is round by observing stars over the horizon" to "some farmer in India told me that there's a rock that kills anything that touches it"


Ну и, конечно, куда же без HealthTech-а. Вот state-of-the-art человеческих знаний насчет менструаций, circa 77 AD (colorized):

Но нелег­ко обна­ру­жить что-то более стран­ное, чем мен­стру­а­ции жен­щин. Когда они в таком состо­я­нии близ­ко под­хо­дят к моло­до­му вину, оно киснет, зер­но­вые куль­ту­ры вслед­ст­вие их при­кос­но­ве­ния пере­ста­ют пло­до­но­сить, при­вои поги­ба­ют, рост­ки в садах засы­ха­ют, пло­ды дере­вьев, под кото­ры­ми они посиде­ли, осы­па­ют­ся, блеск зер­кал от одно­го их взгляда туск­не­ет, ору­жие при­туп­ля­ет­ся, сло­но­вая кость теря­ет свою пре­лесть, пче­ли­ные улья гиб­нут, даже медь и желе­зо тот­час ржа­ве­ют и при­об­ре­та­ют зло­вон­ный запах, и соба­ки, поли­зав их, впа­да­ют в бешен­ство, а укус их про­пи­ты­ва­ет­ся неис­це­ли­мым ядом.

Хорошо, что текущее понимание стало чуть-чуть получше. Хотя до сих пор в медицине (да и во всех других научных сферах) сохраняется огромный knowledge gap между пониманием мужской и женской биологии. Отличная книга на эту тему: Invisible Women: Data Bias in a World Designed for Men

P.S. у Sam O’Nella есть прекрасное эссе о не самых известных персонажах рождественского фольклора — идеально послушать на праздниках 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥31