Время Валеры
29.1K subscribers
194 photos
6 videos
1 file
403 links
Мне платят за то, что я говорю другим людям что им делать.
Автор книги https://www.manning.com/books/machine-learning-system-design
https://venheads.io
https://www.linkedin.com/in/venheads
Download Telegram
Пост для комментариев по стриму
46👍24🔥11
Live stream finished (1 hour)
Второй стрим с Игорем проведем 27 апреля в 15 по Лондону.

В прошлый раз поговорили про рефлексию языковых моделей, немного про алайнмент(нужно развить тему дальше), автономных агентов и неполную модель мира. Так же затронули нечеловеческие условия работы на заводах в викторианскую эпоху и сходство между генеративным контентом и космическим мусором. Даже страшно представить что бы мы обсуждали, будь у Игоря высшее образование, благо у нас была затронута только четверть из подготовленного
😁8014🤡8🔥6👍5🙏4🤗1
Читаю старую статью про churn prediction WTTE-RNN - Less hacky churn prediction из 2016 года. Статья отличная, так как я проповедаю практически то же самое + еще кое-что сверху. Цитата:

The last point is the most important one. One can argue that ‘churn’-modeling is something you should only be doing if you’re in a clear-cut subscription based service. Even then it might be hard. The Netflix-class action lawsuit, where shareholders felt mislead over reported churn-rates, showed that all stakeholders seems to be confused about how to define churn. The court even dropped the case concluding that there’s no official definition of it.
🔥41😁168👍6🤔6🤡4👏1
Live stream scheduled for
По многочисленным просьбам продолжение стрима по Large Language Models будет 27 апреля, но не в 15, а в 18 по Лондону
👍34🔥15👏6👌3🤡3🤩2💩1
Live stream scheduled for
Случилось то, чего я долго ждал, в ранний доступ вышла наша с Арсением книга: Machine Learning System Design With end-to-end examples

Сейчас доступны первые 5 глав (в черновиках есть еще 8), каждую вторую неделю планируем выкладывать по новой главе и править опечатки в выложенных.

Скидка на книгу до 9 мая: MEAP launch code: mlbabushkin (45% off Machine Learning System Design in all formats)

P.S. - Раз пошли промокды, то вот скидка на Hard ML - BABUSHKINCANADA
🔥279🤡38🍾32👍2926🎉17👏6😁4🐳3🤩1👻1
Live stream started
Пост для комментов по второму стриму
Ссылка на слайды и твиты
🦄7
Live stream finished (1 hour)
Хочу поделиться ссылкой на Шаблон документа для дизайна ML-систем от телеграм-канала Reliable ML

Насколько я понял, Ира железной рукой насаживает этот шаблон как стандарт в учебной системе для молодых МЛщиков, хотя мы с Игорем знаем, что никаких молодых МЛщиков не будет
👍57😁3110🔥2
Forwarded from Борис опять
# Рецензия: Machine Learning System Design

Валерий Бабушкин и Арсений Кравченко выпустили в early access книгу про дизайн ML систем. До 9 мая можно получить скидку 45% по промокоду mlkravchenko.

Мне повезло получить копию для рецензии, я прочитал и презентую вам свой отзыв.

Первым делом спойлер: это не про MLOps! Многие могли подумать, что в книге будут учить строить пайплайны на Spark, или оптимизировать инференс нейросетей или что-то в таком духе. Нет. Эта книга про более важный вопрос: как сделать, чтобы ML проект не оказался на полке?

Вот как авторы определяют ML System Design:
> MACHINE LEARNING SYSTEM DESIGN is a complex, multistep process of designing, implementing, and maintaining machine learning-based systems that involves a combination of techniques and skills from various fields and roles

То есть книга о том, как строить ML системы от идеи до планирования до реализации до мониторинга и развития. Сейчас доступны пять глав из шестнадцати. Они покрывают три темы: введение в ML System Design, создание дизайн документа, выбор метрик.

Авторы рассматривают вопросы на верхнем уровне. Лишь иногда вдаются в детали для иллюстрации общих идей. Это хорошо работает, потому что для решения вопросов вроде “как понять, какую систему надо построить?” примеры с кодом не нужны. Особенно ценно, что каждая рекомендация сопровождается реальным кейсом из опыта авторов.

Кому подойдет эта книга? Middle ML инженерам, которые хотят вырасти с уровня реализации фич до уровня стратегического планирования. Senior ML инженерам и тимлидам как настольная книга.

Кому она не подойдет? Я считаю, что она не для начинающих: слишком высокий уровень абстракции. Так же она требует базовых знаний про ML инжиниринг в индустрии, или хотя бы понимания, зачем он нужен.

Лично я даже прочитав доступные пять глав почерпнул для себя много полезного. Например, в книге описано как создать дизайн документ системы. Это лучший подход к сбору требований к ML решению, что я видел. Я буду применять это в работе на текущем проекте. Подводя итог, я думаю, что скоро описанное в книге станет стандартом индустрии.

Напомню, что это рецензия лишь на первые пять глав. Дальше авторы обещают больше хардкора. Книгу можно найти здесь, промокод для скидки 45% mlkravchenko.

@boris_again
🔥104👍3119💩5👏2🤔2🤡2
Когда я только переехал в Лондон, у меня был план. Согласно плану если после первого года жизни мне там нравится, я делаю визу Global Talent и получаю бессрочный вид на жительство не через 5, а через 3 года. Так я и поступил, в декабре 2021 года обратился к ребятам из Immigram, которые все сделали за меня - от меня было только 3-4 раза поговорить с ними по видео и рассказать какой я классный. В начале мая 2022 года получил свою визу.

Не думаю что кто-то удивился , узнав что в 2022 году спрос ну услуги Immigram и любой другой конторы, помогающий с визами вырост в десятки из раз от людей из России, Украины и Беларуси.
Понятное дело, пропускная способность настолько не выросла, отсюда изменилась и скорость работы.

Они проанализировали свои сотни успешных и не очень кейсов и на их базе выкатили платформу где можно самостоятельно собрать себе кейс на Global Talent не занося деньги никаким юристам (непонятно правда в чем тут их выгода). Говорят, что О1 идет следом и уже в разработке.

Сегодня они запустились с ней на Product Hunt - и им нужна поддержка.
👍173🔥46💩2416🤡8👎7
Прочитал небольшую статью Neural Networks are Decision Trees.

Краткая идея простая - we have shown that neural networks can be equivalently represented as decision trees. The tree equivalence holds for fully connected layers, convolutional layers, residual connections, normalizations, recurrent layers and any activation.

Приводят алгоритм как сконвертировать сетку в дерево. В целом, почему бы и нет? Полезного особо не вижу, но удивить друга вполне можно
🤡65👍24🗿23🔥73👏1🐳1
Вышло продолжение ответов на вопросы про А/B тесты, ниже анонс от Карпов Курсес:

Всегда ли для проверки гипотезы необходимо использовать A/B-тест? Можно ли сравнивать попарно несколько разных категорий пользователей? Какие есть подходы к повышению чувствительности A/B-тестов? 

На эти и ещё более узконаправленные вопросы, которые вы задавали Валерию Бабушкину, ответим сегодня во второй части «10 вопросов»
🗿4525👍18🤡9🔥8👏3
Прочитал блогпост Coinbase: Scaling Experimentation for Machine Learning at Coinbase. Хорошо, что я больше не работаю в Blockchain.com, иначе бы сказали, что ругаю конкурента, но блог пост позорный, уровень информативности и нововведений практически нулевой. Настолько, что мне даже нужна помощь, может быть я просто что-то пропустил или не понял? Но начальное заявление : we've built a uniquely elegant approach that combines universes with simple configurations for our ML engines

Не бьется с тем что дальше рассказывают - неслыханное дело, дошли до такой истории как бакеты и что самое смешное, чуваки даже не знают про пересолку:

Hashing in a universe is quite similar to hashing in a split test, using the following formula:
slot_num = hash(universe_name + universe_version + user_id) % num_slots
However, one important aspect to consider is that universe hashing remains consistent over time. This means that historical tests might have a slight influence on the results of future tests. For instance, if a test in slot 1 performs poorly and causes all new users to stop using the app, future tests in that slot could be negatively affected.
To address this issue, we use the "universe version" to allow for rehashing the entire universe when no experiments are running. We've also explored a more advanced technique called "hashing on demand." In this approach, creating a new slot pulls a user group randomly from the entire unused user space rather than from a pre-allocated space. When the slot is emptied, the user group is then returned to the unused user space.

В свое время с @opaOz в Яндексе пересаливаемый конвеер на 1000 бакетов занял у нас целую неделю на имплементацию (вместе с дизайном) и делали сколько угодно экспов в месяц.

На мега платформе coinbase теперь могут гонять до 14 экспериментов в месяц! (пиковое значение)
Еще как мне кажется, чуваки не используют разные слои, хотя на слайде есть Function layer - в тексте про это ни слова

В целом понятно, написали потому что нужно промо, но если я вдруг что-то пропустил, напишите в комментах как я не прав
👍3510😁5🤡3👨‍💻2👏1🤩1
Говорят наша книга вошла в лист топ-10 новых релизов

I wanted to give you some exciting and good news; your book was on Manning's Top 10 Titles list last week, making it one of the most popular and best-selling releases in our catalog.


This is a great achievement and something that you should celebrate with your network.

С другой стороны эти же люди недавно сказали что надо бы продать чуть больше копий за оставшееся до 5 недель с релиза время, чтобы они были довольны

Поэтому покупайте книгу сейчас. Помните, книга - лучший подарок.
🔥116🤡25😁18🎉10👍53👏2