MLinside - школа ML
2.71K subscribers
117 photos
11 videos
111 links
Предзапись на 3 поток курса "База ML": https://clck.ru/3M4hvK
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @mariagartm
Download Telegram
Почему многие начинают путь в ML, но не доходят до результата

Часто от подписчиков слышим: "Я пробовал учить ML, но бросил через месяц". И это не про мотивацию. Это про ошибки, которые повторяются снова и снова:

Хочу все и сразу!

Вместо фокуса на базу, пытаются разобраться во всех алгоритмах, библиотеках и задачах одновременно. Через пару недель начинается выгорание.
Нет цели, зачем все это

Нет проекта, на котором можно применить знания. Все, что учится "в теории", забывается так же быстро, как и запомнилось.
Синдром самозванца: "я не из МФТИ", "я слишком стар для этого", "меня точно завалят на собесе".

И вместо практики — вечное откладывание.
Ноль обратной связи

Учат в одиночку, не проверяют свои гипотезы, не задают вопросы. А без фидбэка сложно понять, ты вообще туда идешь или просто крутишься на месте.
Да на YouTube же много обучающих видео

Смотрят 50+ видео, но так и не открывают Jupyter. Контента много, но системности и прогресса — ноль.

ML — не для избранных. Но это точно не про "просто посмотреть пару лекций". Результат приходит к тем, кто идет шаг за шагом, с фокусом, задачей и поддержкой.

Если был похожий опыт, напишите в комментариях. А мы скоро покажем, как можно пройти путь в ML без этих ловушек.
22🔥4
Excel уже не тянет. BI — запаздывает. Что дальше?

Когда-то Excel был лучшим другом аналитика. Потом появились BI-дашборды — визуализация, автоматизация, чуть больше гибкости. Но сейчас этих инструментов все чаще становится просто недостаточно.

Бизнесу нужны не просто ответы на вопрос “что происходит?”, а точные прогнозы и предложения: что делать дальше, чтобы не потерять деньги и выиграть конкуренцию. Именно это дает машинное обучение.

ML — это не “замена” аналитике, это ее следующий уровень. Когда вы уже умеете чистить данные, строить отчеты, автоматизировать в Power BI — приходит момент, когда хочется решать задачи не по факту, а на опережение. И вот тут Excel уже не поможет.

Почему крупные компании ищут не просто аналитиков, а тех, кто может строить модели? Почему зарплаты вырастают, когда вы умеете больше, чем просто сводные таблицы? Потому что бизнес чувствует: без ML уже нельзя.

Если все чаще ловите себя на мысли, что уперлись в потолок — это может быть сигналом. Возможно, вы переросли аналитику. Время прокачаться до следующей ступени.
10👍4
Как пройти путь в ML и не застрять навсегда

В одном из прошлых постов мы разобрали, почему так много людей годами «готовятся» к работе в ML, но так и не доходят до собеседования. Теперь делимся обещанным разбором, как пройти путь без этих ловушек.
▪️ Не нужно заканчивать МФТИ или Вышку;
▪️ Не нужно учить все на свете перед первым собесом;
▪️ Не нужно ждать «момента, когда я готов». Он не наступит!

Виктор Кантор собрал в одном видео все, что действительно помогает попасть в AI:
▪️как не утонуть в курсах и теориях;
▪️что спрашивают на собеседованиях (и почему это проще, чем кажется);
▪️как выстроить траекторию, если вы аналитик, разработчик или менеджер;
▪️и почему диплом — не билет в профессию, а только один из бонусов.

Это видео сэкономит вам месяцы, а кому-то — и годы.
Посмотрите, если не хотите снова уйти «готовиться» вместо того, чтобы идти вперед.

Смотреть видео на YouTube
Смотреть видео в VK

5 августа начинается третий поток курса "База ML". До его начала есть возможность записаться на курс со скидкой 10% — Анкета предзаписи на курс “База ML”
🔥87👍5
«Кажется, я уперся в потолок»

Это ощущение знакомо многим разработчикам.
Когда все уже умеешь: и фичи клепаешь быстро, и баги ловишь с полпинка, но при этом скучно. Зарплата растет медленно, задачи одни и те же, а перспективы не вдохновляют.

ML часто приходит как естественное продолжение. Не как «смена профессии», а как способ оживить работу: взять что-то сложнее, внедрить чуть больше интеллекта в продукт, не просто "работать", а "создавать".

Если начать с базовых задач, становится понятно, как применять ML там, где раньше даже не задумывались. Например, приоритизировать фичи по пользовательским данным, автоматически искать аномалии в логах, или даже ускорить продуктовые A/B-тесты.

Некоторые из наших студентов так и делают — остаются разработчиками, но с ML-экспертизой становятся незаменимыми в команде. Как раз для этого мы и сделали курс, который помогает специалистам с разным опытом встроить ML в свою текущую профессию. А если в какой-то момент захочется большего, с этой базой можно спокойно идти на собеседование в ML-команду.

Через две недели начинаем обучение на курсе "База ML". Пока места еще есть, но только для тех, что хочет добавить в свою карьеру то, что реально ценится — ML. С программой курса можно ознакомиться на нашем сайте. А если возникли вопросы, пишите нашему менеджеру: @ml_inside_manager
6👍1
Три вебинара, которые помогут вам вырасти в ML

Боитесь собеседований? Не уверены, как применить ML на практике? Хочется понять, насколько вы вообще готовы? У нас скоро пройдут три вебинара, которые закроют все эти вопросы. Вебинары проведет Александр Дубейковский, Middle+ ML-Engineer Авито, ex-Yandex.

📌 29.07 в 19:00 (мск) — Mock-собеседование с Ильей Коченовым
Проходить собеседование будет наш подписчик Илья — студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.
Зарегистрироваться на вебинар

📌 31.07 в 19:00 (мск) — Практический мастер-класс: «Поймай обманщика с помощью ML»
Научитесь находить фродовые транзакции и аномалии в поведении пользователей. Практика, Google Colab, простые ML-инструменты.
Зарегистрироваться на вебинар

📌 4.08 в 19:00 (мск) — Mock-собеседование с Александром Колчиным
Тренироваться в роли кандидата будет наш подписчик Александр — выпускник физического факультета МГУ им. М.В. Ломоносова, занимается рамановской спектроскопией и машинным обучением в задачах хемоинформатики и готовится к смене профессии, чтобы больше времени уделять прикладному применению навыков в области машинного обучения.
Зарегистрироваться на вебинар

Каждое из событий — возможность посмотреть на реальные карьерные истории и потренироваться вместе с экспертами.
8
Как подготовиться к собеседованию, если вы только начали учиться

Самое частое заблуждение — ждать момента, когда вы «достаточно готовы». Как будто есть некий рубеж, после которого на собеседовании не страшно и не стыдно. На самом деле, подготовку к собеседованиям стоит начинать параллельно с обучением. Чем раньше вы начнете к ним готовиться, тем быстрее поймете, в чем именно ваши пробелы.

1️⃣ Первый шаг — разобраться, какие темы спрашивают на позициях для новичков. Почти всегда это базовая математика, принципы машинного обучения и основы Python. Этого достаточно, чтобы понимать суть вопросов и не теряться.
2️⃣ Второй шаг — научиться рассказывать о себе. Коротко, по делу, с фокусом на то, что уже успели изучить и попробовать. Плюсом в рассказе о себе будет собственный pet-проект и/или участие в соревнованиях на Kaggle.
3️⃣ Хорошо работает участие в mock-собеседованиях. Это снимает страх и показывает реальные ожидания работодателей. Вы сразу видите, что нужно подтянуть, и перестаете тратить время на ненужное. Но даже если вы просто наблюдаете за чужим интервью, это уже помогает как минимум понять как проходит собеседование, какие вопросы задают и как на них отвечать. Кстати, скоро мы проведем два открытых мок-собеседования — приходите!

Не стоит надеяться, что пройдете весь путь в теории и только потом пойдете на собеседование. Это путь в никуда. Гораздо продуктивнее пробовать заранее: проходить пробные собесы, участвовать в разборах, разбирать свои и чужие ошибки. Так появляется уверенность, исчезает страх и формируется опыт, который потом вырастает в оффер.

Если вы как раз на этом этапе, напишите, с чем сейчас сложнее всего. Поможем разобрать.

#собеседование
4👍3
В преддверии мок-собеседований с нашими подписчиками мы подготовили небольшой челлендж.

Собеседования по ML-теории, математической статистике и Python проходят практически на все позиции, и именно этот этап становится решающим для тех, кто идет на junior-уровень. Часто именно здесь решается: пройдет кандидат дальше или нет.

Мы собрали несколько базовых вопросов и задач, которые могут встретиться на интервью.
Вопросы и задачи:
1️⃣ Как устроен dict в Python?
2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
3️⃣ Как работать с пропущенными данными?

В это воскресенье разберем их в отдельном посте, а пока ждем ваши версии в комментариях!

#собеседование
13
Готовим Вас к нашим предстоящим mock-собеседованиям и делимся ответами на вопросы с собеседований:

1️⃣ Как устроен dict в Python?
dict в Python — это хеш-таблица с открытой адресацией. Пары (ключ, значение) хранятся в массивах, размер которых увеличивается при заполнении ~2/3. Ключ хешируется через hash(), индекс определяется по хешу. С Python 3.6+ ключи и значения хранятся раздельно (split table) для экономии памяти.

Коллизии решаются квадратичным пробингом: при совпадении ячеек ищется следующая свободная по формуле (hash + perturb) & mask, где perturb уменьшается на каждом шаге. Это помогает избежать кластеризации и сохранять эффективность.


2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
Кросс-валидация — это способ оценки обобщающей способности модели: данные делятся на K частей, модель обучается на K−1 и проверяется на оставшейся, повторяя процесс K раз. Это позволяет:

- выявить переобучение (если валидационные ошибки выше тренировочных);
- получить более стабильную метрику качества;
- подобрать устойчивые гиперпараметры;
- использовать данные эффективнее (вся выборка участвует в обучении и проверке).


3️⃣ Как работать с пропущенными данными?
Как работать с пропущенными данными (по частоте использования):

1. Удаление — строки или столбцы, если пропусков мало или колонка бесполезна соответсвенно.
2. Простая статистика по признакам — среднее, медиана, мода, константа и другие.
3. Маскирование — добавить `is_missing` признак, пропуски заменить фикс-значением.
4. Иммутация по другим фичам — KNN, деревья, SMOTE. Точнее, но дольше и сложнее.
5. Модели с поддержкой NaN — CatBoost, XGBoost и др. умеют обрабатывать NaN сами.
6. Генеративные методы — VAE, GAN, редко и сложно, для особых задач.

#собеседование
14
Завтра мы проводим вебинар, который может изменить ваш подход к подготовке к собеседованиям

Если вы готовитесь к собеседованиям или просто хотите понять, как они устроены в ML — приходите на завтрашний эфир. Это возможность прокачаться даже без прямого участия.

Завтра в 19:00 по МСК мы проведем mock-собеседование в прямом эфире. И вот почему вам стоит на него прийти:

▪️ Можно тренироваться вместе с кандидатом: попробуйте ответить на те же вопросы, что и он. А потом сравните, как бы вы прошли этот этап.
▪️ Вы увидите, как вообще проходят собесы: какие темы поднимают, сколько дают времени, насколько строгий подход у интервьюера.
▪️ Вы услышите разбор от эксперта — что кандидат сделал хорошо, а над чем стоит поработать. Такая обратная связь бесценна, когда вы готовитесь к своему собесу.
▪️ И, конечно, записывайте вопросы. Это не просто собеседование — это живой чек-лист того, что стоит повторить перед интервью.

Собеседование проведет Александр Дубейковский, Middle+ ML Engineer Авито, ex-Yandex, эксперт MLinside. А проходить собеседование будет наш подписчик Илья, студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.

Если откладываете подготовку, потому что «пока не готовы», приходите и посмотрите, что на самом деле вас ждет. Страх уходит, когда вы знаете, к чему готовиться.

👉 Зарегистрироваться на вебинар

#собеседование
8
❗️Важное сообщение
Менеджерский аккаунт @ml_inside_manager временно заморозили, мы решаем этот вопрос с поддержкой.

Пока по любым вопросам можете обращаться к нашему менеджеру Марине: @marinagartm

Как только все восстановим, сообщим в этом канале.
4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
75
Мы начинаем mock-собеседование!
У тех, кто не успел зарегистрироваться, есть возможность подключиться прямо сейчас
4
Хватит теории!
Уже завтра в 19:00 (МСК) Александр Дубейковский проведет практический мастер-класс «Поймай обманщика с помощью ML».

Если устали просто читать про машинное обучение, пора включаться в работу с реальными данными.
На вебинаре вы научитесь:
▪️находить аномалии и фродовые транзакции
▪️использовать базовые ML-инструменты шаг за шагом
▪️писать код и сразу видеть результат в Google Colab

Этот вебинар подойдет, даже если вы только начинаете осваивать ML. Все объясним, покажем, разложим по полочкам.

Если еще не зарегистрировались, сделайте это здесь и сейчас
12
This media is not supported in your browser
VIEW IN TELEGRAM
🔥8🤝2
Мы начинаем практический вебинар!
На всякий случай пришлем ссылку на подключение и в этот канал. Подключиться можно здесь по ссылке
🙏1
Ситуационная задача «Сюрприз в выдаче на проде»

Представьте, вы внедрили модель, которая рекомендует товары для пользователей на сайте. Через три дня после старта А/Б эксперимента вы решили проверить метрики и увидели уже статзначимый профит +7% в конверсии в покупку по сравнению с контрольной группой. В это же время менеджер пишет:
Что-то пошло не так — пользователи видят очень странные товары. Прям вообще не те. Что делать?
🔥6