LeanDS – Telegram

LeanDS

2K subscribers

57 photos

42 files

192 links

Это канал про управление ML/AI/DS проектами и продуктами: видео, митапы, статьи, материалы
Книга 📘 LeanDS https://leands.ai/ru
Все видео на https://www.youtube.com/c/LeanDSRU
Тренинги: https://leands.university
Автор Асхат Уразбаев @askhatu

Download Telegram

About

Blog

Apps

Platform

Выложил на наш канал видео с прошлого митапа. В этот раз аудио записал отдельно, получилось получше, хотя фоновый звук все таки есть. Может кто-то знает как его победить?

Андрей Смирнов — рассказ с элементами трагикомедии о том, как развивался DS внутри ANNA — необанк-стартапа c русскими корнями в UK.

https://youtu.be/10UaOofDFpk

Адам Елдаров из YouDo рассказывает о своем достаточно длинном опыте экспериментов с процессами. У ребят очень большой опыт и DS команда c высоким уровнем зрелости. Лично я для себя очень много подчерпнул.

https://youtu.be/jmjzSor1WDU

В конце решили так просто Адама на отпускать и отдельно оставили его на вопросы. Сделал отдельное видео, оно, как мне кажется, не менее интересное, чем основное.

https://youtu.be/YvLaIE-jFNw

Развитие DS как сервиса в быстро растущей компании, Андрей Смирнов, Head of Data Science, ANNA

Финтех стартап ANNA делает умного ассистента для индивидуальных предпринимателей и малого бизнеса в UK. Команде DS в ANNA 2 года, за это время ANNA сильно поменялась: число разработчиков выросло от нескольких человек до нескольких десятков; одна доска с общими…

852 views09:45

Посмотрите, интересная штука — AI Manifesto. Это некий аналог Agile Manifesto, заточенный под AI. Он состоит из 5 ценностей и 8 приниципов. Сайт создан буквально недавно, манифест можно подписать. Кстати, это совсем новая тема, первые 5 подписантов появились 5 декабря этого года, около 2 недель назад.
https://ai-manifesto.org/

880 views12:39

Тест Джола зрелости вашего DS процесса. Коротенький тест, очень понятный. Надо как-нибудь потестить, интересно кто сколько наберет 🙂

https://guerrilla-analytics.net/2018/01/13/joel-test-of-data-science-maturity/

Guerrilla Analytics: Book, Speaking and Training

13 Steps to Better Data Science: A Joel Test of Data Science Maturity

Data Science teams have different levels of maturity in terms of their ways of working. In the worst case, every team member works as an individual. Results are poorly explained and impossible to r…

730 views20:51

Сколько стоит качество? Разговаривали недавно с Михаилом Рожковым, он считал эффективность внедрения правильных технических практик, обеспечивающих качество. У него получилось внушительные 30-40% снижения трудозатрат.

Это не единственная и кажется не главная задача всех полезных инженерных практик.

Приведу пример. В 2010 экономисты из Гарварда Carmen Reinhart и Kenneth Rogoff опубликовали работу Growth in a Time of Debt, где показали, что при росте долга страны свыше 60% рост ВВП падает на 2%, а при долге свыше 90% примерно на половину. Эти данные неоднократно использовались в политических спорах и привели к значительным сокращениям бюджетов в очень многих странах (включая США и Европу).

Однако, оказалось, что эти уважаемые экономисты просто ошиблись, когда считали свои данные в Экселе (разбор ошибки). То есть такого закона попросту нет. Страшно представить сколько стоила миру простая ошибка в Экселе, просто потому, что ученые не привыкли тщательно тестировать свой продукт.

Глупая ошибка может привести к потерям в миллионы рублей или долларов упущенной выгоды или денег. Критически важно инвестировать в качество и данных и моделей, встраивать качество внутрь процесса.

716 views10:38

НАКОНЕЦ-ТО ВСЕ УТРЯСЛОСЬ!

И мы объявляем третий митап LeanDS. В этот раз он будет посвящен управлению качеством.

В отличии от разработки ПО, результатом работы модели чаще всего являются несколько цифр. Вы уверены, что сделано правильно? Да ладно, если вы специально не верифицируете/валидируете данные и код вероятность где-то около нуля!!!

Как тестировать продукт в AI?

LeanDS3: Качество в DS проектах

1. “Можно ли тестировать искусственный интеллект? Процессы, подходы, практика” - Антон Хританков, к.ф.-.м.н.,МФТИ
2. “Как тестировать DS-код” - Алексей Могильников, DS lead, Банк
3. “Experiment review: код ревью или парный дата сайенс?” - Кисмат Магомедов, Data Scientist X5, Василий Рассказов, Agile Coach, X5

🗓 13 февраля, 18:30-21:00, Четверг

📍 Офис СкрамТрек, м.Курская, Путейский тупик, 6, 13 этаж
✅ Регистрация на событие

PS. У нас есть возможность добавить 1-2 хороших доклада. Если у вас есть что рассказать, напишите мне в личку @askhatu

1.21K views10:50

Channel photo updated

11:21

На митапе 13 февраля будет еще один доклад от Александра Сидорова из HH.ru

Тестирование и мониторинг качества моделей и метрик

Системы с ML - дорогие и хрупкие. То, что ML продолжает приносить пользу, а изменения приводят к улучшениям - само собой не разумеется, нуждается в проверке, тестировании и мониторинге. Я расскажу, как мы, в HH.ru:
- проверяем ML-идеи до того, как начали писать код
- делаем метрики и baseline'ы, чтобы было с чем сравнивать модели ML
- тестируем и мониторим данные для метрик, обучения, расчёта признаков в production
- строим модели на части признаков, проводим time-based кросс-валидацию
- делаем CI/CD для пайплайнов, обучающих модели
- проверяем и мониторим качество, производительность, объём данных для моделей до выката и в prod
- проводим обычные и ухудшающие AB- и TDI-тесты
- мониторим корректность и время расчёта признаков в prod
- валидируем метрики и проверяем их для каждого эксперимента
- встраиваем качество: делаем code review, рефакторинг, применяем framework FeatureGroup, даём разработчикам и DS тестовые стенды, избегаем переключений, многозадачности и перегрузки, снабжаем всё unit- и автотестами, чтобы уменьшить вероятность ошибки человека.

969 views13:14

Привет! Желающих посетить митап LeandDS оказалось так много, что пришлось поменять место проведения.

Митап пройдет в офисе Mail.ru Group: Ленинградский проспект, д. 39, стр. 79.

Обратите внимание, что регистрация обязательна и для входа с собой надо будет иметь паспорт или права.

Время начала регистрации участников 18-00.

Ждем вас!

Если заблудитесь, пишите на +79671344525 (Асхат)

leands.timepad.ru

LeanDS3: Качество в DS проектах / События на TimePad.ru

Lean DS — это серия митапов про большие данные и искусственный интеллект.

13 февраля в гостях у Mail.ru Cloud Solutions c 18-30 до 21:00 состоится третий бесплатный митап по процессам в DS. В этот раз он будет посвящен вопросам КАЧЕСТВА в Data Science проектах:…

940 views12:20

Дружественный митап ML-Repa приглашает к себе! Темы близкие и полезные

688 views12:31

Forwarded from Machine Learning REPA (RU) (ml-repa-controller-bot)

Привет!

Пришло время объявить о первом митапе ML-REPA в этом году. Поговорим про A/B эксперименты и про инструменты для управления ML экспериментами 🚲

📅 Дата и время: 27 февраля (четверг) в 19:00
📌 Место: Офис Райффайзен банка, Проспект Андропова, д. 18, корп. 2 (м. Технопарк)
🎤 Спикеры:
- Андрей Гуревич, Dostavista, Sacred — eщё одна библиотека для протоколирования экспериментов
- Нерсес Багиян, Raiffeisenbank, Ускорение А/Б тестирования с помощью машинного обучения
- Рожков Михаил, ML-REPA, От MLflow к MLPanel: поддержка нескольких проектов, Model Registry и деплой в одном интерфейсе

Регистрация доступна по кнопке к посту. Не забудьте взять с собой паспорт📋

#events #meetup #mlrepa

142 views12:31

Зарегестрироваться можно тут: https://ml-repa.timepad.ru/event/1257624/

ml-repa.timepad.ru

ML REPA Meetup #5: Experimental tools and A/B experiments in Machine Learning / События на TimePad.ru

Очередной митап ML REPA пройдет в офисе Райффайзенбанк. Этот год мы открываем темой про А/Б эксперименты и инструменты для управления ML экспериментами.

1.25K views12:32

В 18-30 состоится трансляция митапа LeanDS3. Ссылка будет опубликована в этом канале в 18-30. Вопросы будем принимать в чате @leands_chat. Ждем всех, кто не может прийти вживую!

796 views10:45

Ссылка на тренсляцию тут: https://www.youtube.com/watch?v=XpIWnDFIkF8 - Welcome!
Начинаем в 18-30

Заходите в @leands_chat и задавайте там вопросы, постараюсь передать их докладчикам

LeanDS3 в Mail.ru Group: Качество в DS-проектах

LeanDS в гостях у Mail.ru Cloud Solutions: https://mcs.mail.ru/yt LeanDS в Tg: t.iss.one/leands Анонсы мероприятий Mail.ru Cloud Solutions: https://t.iss.one/k8s_mail Программа встречи: https://leands.timepad.ru/event/1249938/

839 views15:10

Программа примерно такая. Отсутствие изменений не гарантирую :)

781 views15:17

Огромная просьба: пройти проверку вашей зрелости процессов 🙂 Это тест на несколько минут. Мы подведем итоги в перерыв и разыграем крутой приз — LeanDS футболку, единственную в своем роде (даже у меня такой нет).

https://forms.gle/BLMG9kxhpLsB8LmC9

A Joel Test of Data Science Maturity

Пожалуйста, ответьте на вопросы по вашей команде. Если у вас несколько команд, выберите одну типичную или наиболее важную по отношению к поставке ключевой ценности компании и заполните ответы за нее. Если вы не знаете конкретный ответ, выберите Undecided.…

807 views15:24

Ссылка на презентацию Антона Хританкова
https://tiny.cc/cyqyjz

Тестирование пайплайна - 20200213

Тестирование систем машинного обучения Антон Хританков [email protected] 13/02/2020

881 views15:39

Mogilnikov-How-to-test-DS-code-2.pdf

Алексей Могильников

1.16K views16:21

Magomedov-Rasskazov_Experiment-Review.pdf

Магомедов и Рассказов

996 views17:38

Sidorov-Models-and-Metrics-Testing-Monitoring-3.pdf

Александр Сидоров

1.1K views18:01

Forwarded from Askhat Urazbaev

Когда-то давно я понял, что если хочешь попасть на хороший митап — организуй его 🙂 . Цель всех митапов LeanDS — разобраться, как правильно делать DS проекты. Лично я вообще считаю, что грядет зима AI и ее переживут только самые приспособленные 🙂

Мы с вами разобрались с качеством, ну по крайней мере более-менее стал понятен ландшафт как именно его обеспечивать.

Цель следующего митапа — разобраться, как все-таки эффективно управлять требованиями в DS проектах. Какие существуют этапы DS проекта? Что такое на самом деле гипотеза? Как их брейнштормить? Как подготовить бриф проекта или продукта? Как избежать типичных ошибок? Нужен ли баклог DS продукта и как его собрать?

У меня есть предложение. Давайте проведем митап в два прыжка.

Прыжок первый. Проведем подготовку. Соберем небольшое количество компетентных товарищей и попробуем вечером за несколько часов забрейнштормить на эти вопросы.

Прыжок второй. На отдельном митапе расскажем о том, что у нас получилось + будет несколько классических докладов/кейсов на эту тему.

Для первого прыжка нам нужно разумное (меньше 12) количество ответственных и опытных коллег:

* Бизнес и системных аналитиков
* DS-лиды
* Agile Coach
* Менеджеры AI продуктов

Короче, предлагаю зажечь, напишите если интересно

992 views14:23

На митапе LeanDS#3 по качеству проводился опросик по зрелости процессов. Я обещал победителю майку. По случайности ее выиграл Роман Тезиков из дружественного митапа ML-Repa (честно, оно само).

881 views10:41