Dimension AI | Dmitry Sirakov
1.93K subscribers
108 photos
3 videos
1 file
43 links
Рассказываю про NLP и образование.

Ссылка на чат - t.iss.one/dimensionchat
Связь - @Shadekss
Download Telegram
Академия Аналитиков Авито - это программа обучения от самой крупной платформы объявлений в России.

Заявка -> Тестирование -> Тестирование -> Собес -> Начало обучения в сентябре.

Прекрасный Pipeline.

Есть два трека:
Аналитик Данных - начинают с классического Python, а заканчивают Analytics Deep Dive.

ᐅ ПРИКЛАДНАЯ СТАТИСТИКА
ᐅ PYTHON
ᐅ SQL
ᐅ ЭКОНОМЕТРИКА
ᐅ ЭКСПЕРИМЕНТЫ
ᐅ ВИЗУАЛИЗАЦИЯ ДАННЫХ
ᐅ МЕТРИКИ
ᐅ MACHINE LEARNING
ᐅ ANALYTICS DEEP DIVE

DS-engineer - начинают с классического ML, а заканчивают ML System Design и Pet-project.

ᐅ MACHINE LEARNING
ᐅ АЛГОРИТМЫ
ᐅ PYTHON
ᐅ ДАТАСЕТЫ
ᐅ ИНФРАСТРУКТУРА ML
ᐅ ML SYSTEM DESIGN
ᐅ ML КУРСОВЫЕ ПРОЕКТЫ

Та академия, про которую сейчас говорят меньше всего(имхо, незаслуженно). Отбор в ШАД закончился, теперь черед ААА. Нужно знать хорошо матешу и уметь писать на питончике. Отбор жестковат говорят, но эт мы проверим.

Задают достаточно хороший уровень нагрузки(3 вечерних лекции в неделю), а не как в Тинькофф 0 дз за 3 месяца и 2 лекции в месяц.
Есть менторы, преподы и курсач - что не может не радовать, ведь существует постоянная коммуникация, а не как в Тинькофф вопросы в чате висят месяц и ты попадаешь в тотальный игнор

Прекрасно подойдет тем, кто хочет вкатываться в DS-сферу.
DeadLine подачи заявки - 13.06.23. Подавать тут

#Education
🌚5🔥3😈32👾2👍1🦄1
Check comments…
Примерно так я получал свой мерч от Тинькофф (окончил курс Classic ML ещё в январе, мерч доставили только сейчас, зато какой…)

UPD: Доставили кредитку как мерч
4👎1
Я закрыл все самые сложные предметы своей сессии. Новый этап - 1 июня.
Думаю, что лето, благодаря этому продукту, пройдет максимально продуктивно..

Подробности позже..
🔥4😈2
На самом деле изначально этот канал создавался как блог - Прохождение Cимулятора ML от karpov.cources.

Действительно интересно, насколько сильно я поднимусь в своих скиллах за такую скромную сумму(21,000), занимаясь при этом 3 месяца и достаточно упорно.

Кто не знает:
Симулятор ML - сервис, в котором поднята своя инфраструктура, которая имеет схожесть с огромным количеством больших компаний. Задачи в этой инфре - как практика в крупной компании.
Есть теоретические вкладки, есть качественно подобные ресурсы(видел спойлеры от BOGDANA), с которых черпать. Есть все для практики.

В общем, эксперимент.
Что я умею сейчас -> что будет через 3 месяца?

🔥 Покупка курса запланирована на 1 июня.
Please open Telegram to view this post
VIEW IN TELEGRAM
10😈4❤‍🔥2👍1
Тинькофф читает мои мысли 😉
или посты..
😈42🔥1
👍7🫡4🔥3😈2
Кстати это первый курс, который я купил дороже 2,000₽

Самый дорогой - курс по Решению Параметров ЕГЭ. За 1800₽.
🤯5😈4
достаточно лаконичный и плавный ввод, на самом деле.

Редко где я такое встречал, хотя курсов я прошел достаточно.

Самое главное - веб как не выгорать!
5❤‍🔥3
Первый день симулятора (1/90)

Про выгорание и пр. - классно. Думаю, так и стоит начинать различные курсы. Типа смотрите, как надо, а теперь делайте. Мне понравилось.

За сегодня выполнил 4 задачки уровня Intern.

- Сходил в БД, сделал запросы, вспомнил базу SQL.

- Узнал для себя новые метрики, посчитал их с помощью numpy. Я и не знал, что стандартное деление ‘/‘ - медленное, а есть np.divide(), где можно, например, сразу проверить на ненулевой знаменатель)

- Все нужно было разобраться с регулярными выражениями, время пришло. Надо было оптимизировать код в 2 раза… И тут тоже не знал, что нужно компилить регулярную строку, ибо так быстрее, а если мы этого не сделаем, то компилиться она будет каждый раз с нуля…Удивительные вещи.

- Была задача на Pandas. Суть такова, что нужно заполнить NaN пропусками по группам. Самая распространенная задача - тупо заполнить средними, а тут целый .groupby() добавить!!
Посмотрел для себя .transform() удобная вещь, все руки не доходили ее потрогать на практике.
Ну и меганеочевидное условие…Должны заполнить целыми числами NaN’ы, кто ж знал, что нужно использовать .round(), а не .astype(int).

- Вообще, много чего нового узнал. И про pytest, и про pylint, и про MLflow(раньше работал ток с ClearML) и про сведение стандартных задач к аномалиям.

Продуктивность зашкаливает, мне понравилось, на самом деле.

Ну, а еще наконец допилил офигенный DashBoard с авторизацией, красивыми Histogramms, Polar Bars, поиском по датафреймам, выгрузке красивой(!!) в эксель. ETL(Extract-Transfrom-Load) пайплайном(строил полностью с нуля) полностью налажен.
Осталось к DashBoard прикрутить ML модельки, чтобы предсказывалось численное значение в этих данных..Могу запилить отдельный пост с демо и огромной статьей о том, как это было
🔥11👍2😈2