Заскуль питона (Data Science)
6.16K subscribers
110 photos
15 videos
4 files
142 links
Канал про Python, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Чат: https://t.iss.one/my_it_frogs
Download Telegram
💞 Вы проделали хорошую работу по A/B тестам, давайте отдохнем и переключимся с A/B на SQL. Знание основных моментов позволит вам приблизиться к заветному офферу аналитика. Хотя, работа аналитика заключается не только в написании запросов SQL, хотя это тоже очень классно уметь.

В основном, предстоит работать с SELECT и писать запросы в уже существующую базу данных (ClickHouse, Oracle, PostgreSQL и др.). Сам по себе SQL несложный, но для перехода в IT-индустрию он нужен, как ни крути.

🍪🍪 Что спрашивают обычно на собеседованиях или что спрашивали меня?
> что будет, если заджойнить 2 таблицы, сколько строк выведет?
> какой запрос вернет большее количество строк?
> какими способами можно удалить дубликаты в таблице? (Спойлер: больше трёх)
> синтаксис, какие операции выполняются в начале. Может быть огорчу кого-то, SELECT в конце.
> решить продуктовую задачу, определить n-day Reteniton и другое.

💡 Если у вас есть какие-то проблемы с этим, советую ознакомиться с источниками, которые прикреплю ниже по степени приоритезации.
> 🔥 симулятор SQL от karpov.courses - все структурированно, хорошие лекции и задачи. С 30 января будут доступны продуктовые задачи (по типу расчета Churn Rate, Retention, возможно) + можно попрактиковаться в Redash. Визуализация + запросы.
> доисторический тренажер, советуют в том числе и крупные компании, такие как 🏦. Много разных задач, после прохождения будете щелкать задачки на раз-два.
> тренажер на stepik. В свое время он помог структурировать знания и попрактиковаться. Спойлер: оконных функций нет, что печально.
> sql-academy. Много задач, наткнулся по советам 📦, когда готовился к стажке.

Когда вы прошерстите хотя бы первые два. Поймете про подзапросы, группировки, JOIN и оконные функции, можно приступать к решению задач с собесов крупных компаний.
> itresume - задачи отфильтрованы по сложности, можно выбрать для себя некоторые и порешать, например в альфу. Доступ к премиуму можно получить за приглашение друга, надеюсь, вы знаете как это можно заабузить.
> stratascratch [EN] - 500+ interview coding questions (Facebook, Google, Microsoft, twitch).
> datalemur [EN] - то же, что и stratascratch, можно встретить другие задачи.

Накидайте 40 реакций на пост и выйдет следующая часть по A/B тестам, если вы, конечно же, этого хотите 😡
Please open Telegram to view this post
VIEW IN TELEGRAM
32🐳7👍4🔥2
⚽️ Следующий пост будет про Excel, для стажёров маст-хев.

Ставьте 👍🏽, чтобы пост вышел быстрее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53💩3
Всем привет, как и обещал, пост про Excel

Вообще, приходится сталкиваться с работой в нём, но самое главное, что обычно взаимодействие с ним выглядит для стажёров 💼 следующим образом:
> выгрузи данные из БД.
> сформируй дешборд, сводную таблицу.
> сделай выводы.

В некоторых компаниях может возникать проблема, что данные хранятся в нескольких БД, поэтому выгрузка запросов из каждой БД и дальнейшие действия в Excel могут решить эту проблему.

✏️ Важно:
> понимать то, для чего делаются те или иные функции.
> быстро и правильно проводить вычисления.
> уметь найти ошибку в формуле.

🎩 Основные функции, которые применяются на работе и которые были на стажке 📦:
>
ВПР, ГПР - по сути тот же JOIN, который мы используем в SQL (более подробно по SQL можно глянуть туть).
документация
> ЕСЛИ - условие, по которому мы определяем соответствие значения. Условно, если элемент такой, выведи одно, иначе - другое.
документация
> СЧЁТЕСЛИ, СУММЕСЛИ - складывают / считают значения при каком-то условии. Например, нам из таблиц по странам нужно вывести объем продаж по России.
документация
> СЦЕП / СЦЕПИТЬ - та же функция CONCAT (объединяет строки).
документация
> ИНДЕКС в сочетании с ПОИСКПОЗ. Суть заключается в том, что такой синтаксис позволяет джойнить по нескольким столбцам. Например, из таблицы с объемом продаж по странам у нас есть также города. Нужно вывести объем продаж по конкретному городу (при условии того, что названия городов могут повторятся в разных странах).
почитать можно тут

🫣 Конечно, это не весь список, но работодатели хотят видеть именно то, что вы умеете работать с данными функциями и понимаете для чего они нужны. Также стоит отметить, что все не ограничивается формулами, есть также и визуализация, форматирование и др. Про вещи, связанные с закреплением строк, типичных операций по типу СУММ, СУММПРОИЗВ и др. здесь не будет. Если рассматриваете Excel с нуля, советую глянуть следующие материалы.

> курс от Яндекс по Excel
> курс от Альфы - сводные таблицы, группировки данных и многое другое

➡️ Тестовые датасеты можно посмотреть на kaggle, можно выгрузить в csv, запихнуть в Excel и покрутить на реальных данных, попробовать сделать дешборд, сводные таблицы.

[EN] Можно глянуть crash-course по Excel на английском языке (6 часов), если дойдут у вас руки. Ссылка тут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🐳42🤮1🥱1
💼 Почему ходить на собеседования важно?

Привет, мир, сегодня я хочу затронуть одну из самых важных тем, касаемую собесов. Будучи трудоустроенным, я продолжаю ходить по различным компаниям, чтобы…

📈 Очевидно, это получение более сочного оффера. Это само собой, вопрос о самореализации.

Но основная цель заключается не в этом.

🫣 Когда я только начал погружаться в IT, аналитику, хотелось устроиться на место, где буду решать классные задачи, грейдиться в профессиональном плане.

Сейчас это мне нужно для того, чтобы:

> быть в тонусе, чтобы легко решать задачки на собесе
> чувствовать себя уверенно и внушить себе, что это очередной мит
> понимать тренды в компаниях.

Например:
🏦 - преимущественно офис 5/2, 2-3 этапа.
🏦 - берут людей из вышки, бомонки, мгу, мфти, остальные не попадают под ключевики. Если попали, повезло.
📦 - перешли на SuperSet (BI-система), поэтому можно для себя глянуть этот инструмент и владеть им.
📱 - 4 этапа, классика практически на любой вакансии.
📱 - отдельные структуры придерживаются таких же этапов , что и Яндекс, поскольку вышли относительно недавно.

😱 Раньше было очень страшно общаться с HR, рекрутерами, однако, сейчас чувствуешь себя более расслаблено и нет какой-то тревоги.

Вывод:

Ходите на собеседования и не бойтесь HR, они не откусят вам голову

Накидайте 🐳, если вам понравился такого рода пост, всем продуктивных выходных!
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳73🔥43👨‍💻2👍1🤮1
Ура, нас уже 600, я в шоке! 💼

Спасибо, что продолжаете следить за новостями, именно вы заставляете писать посты, придумывать что-то новое, делиться опытом. Всех люблю 🐸
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳206🔥3🤩1🌭1💅1
Как перестать бесконечно учиться и получить заветный оффер?

Согласитесь
, у вас было такое, что продолжали решать типичные задачи с различных тренажеров, видео, слитых или нет курсов, в надежде на то, что это повлияет на вас как-то профессионально (больше опыта, навыков, работодатели точно оторвут с руками и непонятно где потолок). 🤵

😣 Боюсь вас обрадовать или огорчить, постоянное обучение без практики - не есть хорошо, а вы, не будучи уверенными в себе, попадаете в ловушку бесконечной учебы и не понимаете, когда же настанет тот момент, когда вы станете топ-специалистом. Спойлер: только практика. Но как это делать правильно, чтобы все-таки получить оффер и понять с какими задачами предстоит столкнуться?

😌 В мире Data Science существует большое множество теории, но охватить всё невозможно. Единственный вариант - в один момент себе сказать: "Пора работать, я знаю достаточно!" Да, звучит весьма специфично, что-то в роде инфоцыганства. Однако, кто знает, что вы хотите устроиться на работу? Только вы!

Лишь походив по собесам, я понял где находится потолок на каждой из вакансий (по знаниям, которые вы в теории можете получить). От привычного SQL, Python, EDA, тервера и статы до ML, анализа текстов и др. Прикольно понимать то, что вам нужно подтянуть под конкретную компанию. Первое время стараешься угнаться за оффером, а потом ходишь и подтягиваешь то, что у тебя не получается.

🍪🍪 Например, как было у меня:

Одним из моих первых собесов был 📱 на позицию Product Analyst. Меня попросили рассчитать Retention 5-го дня в SQL (на то время, я не знал, как сделать это корректно). И начиная с этого собеса я начал копать в сторону продуктовых метрик и их расчета. В 📦 на Middle Product Analyst дали тестовое задание с генерацией распределений и расчетом метрик, понял, что это важно (например, для A/B тестов). Ещё в 🏦🏦 понял, что нужно копать в сторону статистики и знаете, даже как-то подсел на подобного рода вещи.

Я не говорю про тех, кто сейчас усердно работает и подтягивает знания из разных отраслей, те же миты, встречи, курсы, это всё ок. Речь идет про тех, кто не может остановиться учиться и не понимает где же потолок. Выяснить это можно, общаясь с тимлидами, HR, раскидывая резюме как на hh, careerspace, jobby, так и на сайтах компании работодателя 🥂

Но что же делать человеку без опыта и как перестать получать 100% отказы?

Если на посте наберется 100 🐳, расскажу про это более подробно.

P.S: Админу нужно время
🎩
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳187👍10👎21👨‍💻1
Как получать меньший процент отказов и стать котируемым на рынке?

Или как получить опыт без опыта?

Вот вы ботаете очередной курс, читаете книги, смотрите задания по матеше и решили, что надо пойти работать. Вполне здравая мысль, когда человек задумывается о самореализации. Но вот незадача, на работе, оказывается, нужен опыт 🧢

Всё, выхода нет, нужно продолжать учиться, опять лягушонок несет очередную дичь. Однако, выход всё же есть, не стоит расстраиваться 🔥

1. Стажировки.

Достаточно классный буст в бигтех компании. Компании в течение года набирают стажеров, а также проводят массовый набор в рамках специальных ивентов.

🏦 Тинькофф
️ Future Today
📦 OZON
🏦 SberSeasons
📱 Яндекс
📱 VK

2. Хакатоны / Кейс-чемпионаты.

😂 Подходит не только для студентов + можно упаковать в опыт, если мы говорим про такие вещи, как Python, SQL, BI, метрики и др. Звучит весьма интересно, поскольку не обязательно выигрывать, главное покрутить данные, получить необходимые знания. Конечно же, можно шлифовать различными курсами, чтобы по знаниям было все более-менее структурированно. Кроме того, нетворкинг, который очень сильно решает.

Ближайшие мероприятия:

📱 MTC ML CUP (уже идёт, можно регистрироваться)
Молодежный бит от РосМолодёжи, хакатон (17-19 февраля. Регистрация до 14 февраля). Направления: Аналитика, дэшборды, Web
AeroSpacePro, хакатон (28 февраля - 18 апреля. Регистрация до 26 февраля).

Достаточно не густо пока что. Можно отслеживать тут 👧

3. Kaggle.

Находка для ML-специалистов и DS. Очень много датасетов, можно участвовать в соревнованиях, а потом в резюме указать, что вы Kaggle Grandmaster
> A/B тесты
> Модели, ML
> EDA и многое другое 📸

4. Pet-Projects.
Собственные проекты, которые вы расцениваете как хобби. Это может быть и написание телеграм-бота, крипто-бота, калькулятора, что угодно. Суть в том, что вы скидываете это на GitHub, коммитите ветки и показываете работодателю, что долго и усердно работали над чем-то ☕️
Статья_1
Пример GitHub с Pet-проектами

5. Расширение деловых контактов.
Да, это тоже важно. Посещение различных митов, добавление контактов в линкедине, общение в чатиках тоже влияет. Когда с вами делятся опытом, это очень классно + вы начинаете глубже понимать специфику того, чем занимаются другие 🤵

6* Прохождение курсов с практикой.

Зачастую эти
курсы платные, но дают классный опыт. Например, Яндекс.Практикум 📱 или karpov.courses 🔥

🚪 Этот список может продолжаться до бесконечности. Тот же фриланс, подработки и прочее. Как мне кажется, здесь выделил основные моменты, которые сократят количество отказов и помогут получить опыт без опыта.

Давайте попробуем набрать 150 🐳, если вам понравился пост и я обещаю выпустить что-то интересное
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳130👍8💅2
Решил удалить обсуждение, в итоге комменты слетели, bruh…

Решил возродить чатик

Пишите свои вопросы сюда 🤵
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡13👎2🤯2🌚2😭2
Как перестать разочаровываться во всем и начать жить?

Всем привет, в
этом посте я накидаю мыслей про выгорание и расскажу про то, что делать с этим ☕️

Когда вы только начинаете искать предназначение в жизни, руки могут опускаться по ряду причин 👀

> Очень много конкурентов. Уже есть десятки тысяч классных специалистов, чем они хуже меня? Про это будет написано ниже.

> Знания, которые я получаю не дают того эффекта, который я изначально закладывал для себя.

> Работа превращается в день сурка и теряется смысл от того, что я делаю.

Когда я учился в школе, думал, что в IT итак много специалистов, поэтому поступал в ВУЗ по обществознанию. Скорее, здесь про уверенность в себе, ты не готов разобраться в структуре рынков, а у тебя внутри есть какой-то барьер 🔥

Начиная развиваться в IT, я перестал завидовать успеху других людей, даже если они достигли его в раннем возрасте. У них свой путь, у меня свой… На первое время я перестал смотреть на достижения окружающих людей, чтобы не тильтовать лишний раз. Потом постепенно начал интересоваться тем, чем занимаются «коллеги по несчастью», чтобы расширить кругозор, барьер преодолён 😮

Вот смотришь курсы, полезные материалы и в один момент понимаешь, что профита никакого нет. Да, это звучит весьма нормально, ты стоишь на месте и не можешь получить нормальный оффер. Я всегда был категоричен к себе и не давал себе отдохнуть, покручивая датасеты, смотря документацию, и в один прекрасный момент меня начало воротить от того, чем я занимаюсь. От того, что вы выделите себе время для отдыха, не будет хуже, а выгореть будет сложнее (для меня это тяжело, поскольку отдыхать нормально я не умею и лишний раз хочется прогрейдиться в короткое время) 😢

Но вот, свершилось чудо и вы получили оффер, но, проработав какое-то время, понимаете, что работа превратилась в рутину, а интерес пропал. Да, такое тоже бывает, нужно уже на стадии обучения понимать, что какие-то вещи будут привычными и ежедневными, однако, выход есть. Можете поговорить с руководителем и узнать, будут ли задачи, которые вам будут интересны. Если понимаете, что нет, советую походить по собеседованиям, кстати, пост можете глянуть тут 👧

Делитесь своей историей и тем, как вы боролись с выгоранием, будет интересно почитать.

Давайте наберём 150 🐳 и в следующем посте я расскажу про свой путь в IT 🧃
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳106👍62🤨1
Друзья, всем привет!

Мои кореша из 🔥, точнее их Content creator Симулятора ML организует митап, на котором с вами поделится различными лайфхаками, как сделать свой пет-проект и как войти в айти без опыта (это не всё).

💼 Дата проведения: 16 февраля, 19:00

📸 Формат: Оффлайн, РЭУ им. Г.В. Плеханова (г. Москва)
📍Стремянный переулок, дом 36
UPD: по возможности выкатят запись.

Приходите, будем ждать 🚪

Ссылка на регистрацию
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳22👍7🤩2
Думаю сделать пост с задачами, которые попадались на позициях Data Analyst, Product Analyst в 😀, 🏦, 📱, 📦

Накидайте реакций, если эта тема вам интересна 😇
Please open Telegram to view this post
VIEW IN TELEGRAM
👍152🐳40🔥8🦄743😍2💘2🥰1🤯1🎉1
1️⃣0️⃣0️⃣0️⃣❗️

Исторический момент, друзья. Спасибо, что
остаётесь со мной. Напишите, чего бы хотели видеть на канале в будущем 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳52🦄42🔥2😱2🎉2😍21🤯1🤩1🌭1
Всем привет, в этом посте поделюсь задачами с различных собесов. Здесь буду кратко резюмировать то, что реально было на собесах, в тестовых заданиях 🧐

📦 OZON

👩‍💻 Задание на Python (pandas, numpy, знание функций, циклов, визуализаций, распределений)
> обработка данных
> агрегирующие функции
> удаление выбросов.
> визуализация

Например: нужно было сгенерировать user_id из цифр и букв длиной 15, при этом это должно экстраполироваться на 10000 строк 😏

👩‍💻 Задание на SQL (тетрис). Оконные функции, превращение «узкой» таблицы в «широкую», подзапросы, JOIN

Логика, тервер, стата, здравствуйте 💪

😀 Яндекс

📞 На первом созвоне с HR дали тервер для того, чтобы быстро понять, нужен ты им или нет.

Ну и вопрос на подумать:
Когда продавцу на Яндекс.Маркете выгодней всего продавать товар ниже себестоимости? Ответы пишите в комментариях 😬

📞 Второй созвон - теория вероятностей и математическая статистика. Поговорили про основные моменты, связанные с определением Sample Size через MDE, когда вариант A/B надо катить в прод и как выбрать систему сплитования, если на разработку даётся 2 дня. Если мы говорим про тервер, это типичные задачи на шарики с ящиками, условные вероятности, Байес и другие.

📞 Третий созвон -
алгоритмическая секция. Наводит ужас, не правда ли?

👩‍💻 Задача уровня LeetCode medium+

👩‍💻 Задача на оконные функции, не помню уже условия, но суть такая, что у нас есть таблица, которая имеет следующий вид:

id - int
time - int
value - varchar

Если мы видим пропуск в value (NULL) заполнить ненулевым значением, которое встречалось в партиции в сортированной таблице.

В конце поговорили про A/B тесты, различные сложности, которые могут возникать и другое.

🏦 Если вдруг решили устроиться 5/2 офис, мы вас ждём.

📞 Первый созвон

Больше про продуктовое мышление, дали кейс, по которому нужно было выбрать относительные метрики, как можно будет отдавать для разработки дешбордов.

📞 Второй созвон

👩‍💻 Из разряда, что выведет код, List comprehensions, функции, строки, словари. В библиотеки не залезали

👩‍💻 Какая ошибка в запросе, что выведет запрос

> нет группировки
> ошибка в JOIN и др.

Ну, конечно же, куда без тервера и шариков 😬

😶 Вывод:

Если хотите в Яндекс, решайте алгоритмические задачи на LeetCode, находите оптимальные решения, потому что зачастую спрашивают следующее: а можно как-то проще, чтобы сложность понизить? Не забываем про статистику и тервер, конечно же 😱

Если хотите в OZON, решайте более прикладные задачи, играйте с библиотеками, SQL, благо сейчас ресурсов тонны 🤤

Если хотите в Сбер, также решайте прикладные задачи, но не упарываясь в оптимизацию, также и с SQL 🫠

😍 В честь праздника, ловите небольшой подгон в виде самих заданий (часть из них удалось сохранить). Ссылка тут

Накидайте реакций, если понравился пост, и увидимся уже на митапе по ML в плешке (16 февраля) 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
82🔥21🐳15👍11🌚2🌭2❤‍🔥1🤯1😍1
Начал писать пост про Road-Map для Junior/Intern Data-Analyst 😱

Расскажу про:
🤔 Основные инструменты, hard-skills

🤩 Как бы я выстраивал план обучения сейчас

😅 Расскажу про то, как можно найти первую работу

🛍 Ну и расскажу про планы на будущее, в каком направлении хочу двигаться.

🚗 Накидайте реакций, если эта тема вам интересна. Пишите комментарии, что бы хотели видеть по данной тематике
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳14717👍12😍5🔥43🕊3🦄3💘2🎉1🌚1
🥪 ROAD-MAP DATA ANALYST

Hello World
, в сегодняшнем посте хочу рассказать про HARD-скиллы, которые помогут вам стать запакованным стажером / джуном дата-аналитиком. Да, тема достаточно заезженная, но можно составить какую-то Road-Map для этого. Хочу максимально разжевать это, чтобы было какое-то понимание. Вот, вы решили стать DA, потому что это достаточно перспективное направление. Окей, все классно, но с чего же начать?

🤤 P.S: я хочу выстроить план на основе того, через что мне предстояло пройти. Волшебной таблетки нет.

Какой же «Истинный» пак дата-аналитика?

👩‍💻 Python (pandas, numpy, matplotlib, based functions in python)
👩‍💻 SQL (оконные функции, джойны, группировки, подзапросы, работа с таблицами)
😎 BI-System (визуализация, дешборды, адаптация скриптов)
🤓 Probability theory and statistics (условная вероятность, ЦПТ, доверительные интервалы, проверка гипотез, распределения и др.)
📱 Google Searching (да, полезный навык, который сократит время ожидания ответа от других пользователей, любителям nometa.xyz привет)
🧑‍🎓 Product metrics, business thinking (понимание для чего вы проводите те или иные расчеты, какую пользу вы несете бизнесу / продукты, упор на метрики)
🔒 Excel*. Запрашивают на стажировках, иногда используется для выгрузки отчетов, создания сводных таблиц.

В какой же последовательности я бы изучал сейчас?

0️⃣ Google Searching

Казалось бы, зачем это всё надо? Оперативно найти вопрос по интересующей вас теме на зарубежных форумах и не тратить своё время и время других на решение какой-то проблемы. Сейчас так вообще, можно забить всё в ChatGPT и решить конкретную задачу. Здесь речь идет скорее про то, что гуглить - это важно и в этом нет ничего такого.

1️⃣ SQL

В целом, похож на pandas (Python library), выстроенная структура поможет быстро адаптироваться под Python и начать работать с реальными данными. Номер один сейчас, имхо - это 🔥, там есть и работа с SQL, а также работа с дешбордами и продуктовыми метриками, очень крутой курс. Окей, мы научились пользоваться оконными функциями, подзапросами, джойнами. Но аналитик - это не тот, кто пишет только SQL-запросы, не правда ли?

2️⃣ Default Python
Окей, мы продвинулись дальше, на очереди Python. Его нужно знать хорошо, чтобы писать функции и применять к конкретным переменным, понимать работу циклов, работу со словарями, строками, списками. Здесь можно без ООП, нам нужно быстро прогнать теорию и научиться реализовывать это на практике. Есть классный 👩‍💻 от ODS и Игоря Котенкова, всё достаточно классно разжевано, советую посмотреть.

3️⃣Probability Theory and statistics + Python
Далее, математическая статистика и теория вероятностей. Предлагаю совместить это с Python, поскольку голая теория по этим двум дисциплинам очень плохо запоминается, а практика важна. Предлагаю начать со статистики и теории вероятностей на Stepik. Ранее, я скидывал тестовое разных компаний, можно глянуть тут. Сгенерировать свои данные и посмотреть как это реально может работать, понимать распределения, описание статистики + подкрепить A/B тестами, если хотите. Можно посмотреть вот этот мини-курс, чтобы понять как статистика и теория вероятностей работает в Python.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳23👍12❤‍🔥42👏2💘1
4️⃣BI-Systems
В основном, это средство визуализации, построение дешбордов, но на 1 шаге, мы уже их строили, более глубже можно узнать, посмотрев курс тут. Друг на друга они в целом похоже, поэтому выбрать BI-систему для изучения - не так важно.

Но зачем в итоге нужны аналитики, почему не может всех заменить OpenAI? Во-первых, кто будет составлять запросы для ИИ? Во-вторых, кто понимает специфику бизнеса и интерпретацию различных метрик?

5️⃣Business and product thinking
Понимание этого помогает вам и компании, в которой вы работаете, расти. Однотипные выгрузки, преобразования данных без формулирования выводов не нужно. Мы должны видеть, где проблемы в нашем продукте, чтобы впоследствии можно было принять решение по его дальнейшему развитию. Тренажер для погружения в продакт-менеджмент

6️⃣*️⃣Excel
Если вдруг понимаете, что вам это нужно (для стажировки, работы), "ботается" за 3-4 дня. Курс по Excel c практикой

🏋️ Как же набрать опыт?
Ну, без опыта вас не берут на работу, а без работы у вас нет опыта. Всё, жизнь, ужасна. Посмотрите мой предыдущий пост, там написаны основные пути решения. Упакуйте участие в каких-либо проектах как релевантный опыт. Зачастую HR смотрят на стек, что вы делали на работе, а также стаж.

🛍 А теперь, что же у меня по планам?
Хочу провести эксперимент над собой и запустить формат марафона по Machine Learning, Deep Learning, где буду делиться тем, как продвигается обучение, что смотрю. Начинаю с относительного нуля, но есть желание в этом разобраться. Пишите комментарии, интересно ли это будет вам.

👍 Ставьте реакции, если пост понравился

По Hard-скиллам можете также посмотреть у моего друга с канала
Блог о Data Science, ссылка на пост тут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🐳177❤‍🔥4
🚗 Спринт Machine learning и Deep Learning или как не сойти с ума

😅 Всем привет, пока что я готовлюсь по алгосам в 😀, параллельно просматриваю материалы по ML и DL с нуля. Хочу пройти этот путь и создать своего чат жпт, конечно же.

🤔 Как вообще я это вижу?

Беру курс, читаю статейки, делюсь с вами и вместе мы идём к изучению сложных направлений. Например, посмотрел линал, нашёл интересные конструкции на 👩‍💻, поделился с вами, Поучаствовал в соревнованиях, поделился своим видением и т.д.

Предлагаю выкладывать результаты каждую неделю, чтобы можно было более корректно отследить что-то новое.

😇 Пишите свои идеи по такому формату, поддержите реакциями если интересно будет посмотреть реалити-шоу с манагером из РАНХиГС (мой бекграунд, да-да)
Please open Telegram to view this post
VIEW IN TELEGRAM
32🐳21👍4👨‍💻3🥰2
🔤🔤 🔤 🔤🔤 1️⃣🔤

Всем привет, выпускаю пилотный пост своего погружения в Machine Learning и Deep Learning. В целом, пока идёт всё нормально, смотрю про линал. Вопрос к тем, кто знает, зачем нужен линал в ML и DL, если мы все равно засовываем матрицы фич в модель, пытаясь добиться высоких показателей метрик качества? Или это нам нужно для того, чтобы понимать, как все работает под капотом?

Что посмотрел?

🧑‍🎓 Теория вероятностей и статистика
🧮 Линейная алгебра (вектора и матрицы)
💻 ООП в Python, повторение синтаксиса с либами
💻 Рассмотрел KNN задачу классификации, линейную и логистическую регрессию
😱 Transform, Scalers
😨 Я также продолжаю решать алгоритмы для структуризации действий

Прохожу курс ИИ Старт на Stepik от МФТИ и Deep Learning от МФТИ также, пользуюсь стандартной документацией под библиотеки (sklearn, pandas, numpy)

😇 Расскажите, как практикуетесь вы? Ставьте реакции, если такой формат вам нравится
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳298😍3❤‍🔥1
😇 Как ускорить своё обучение в несколько раз?

Мотивационный пост? Нет, практический.

😡 Смотря на тенденции IT-рынка, мы скоро придём к тому, что всем будет заправлять ChatGPT и компании, которые используют соответствующие ИИ. Смерть кожаным мешкам? Не думаю, хотя сокращение сотрудников говорит об обратном.

😱 Сейчас из под каждого утюга слышно про какие-то «прикольные» AI-инструменты, которые могут написать курсовые, решить задачу или просто рассказать про то, как сделать самый вкусный в мире плов или отредактировать CV. Предлагаю использовать их с пользой для себя, но это не волшебная таблетка, лишь дополнительный инструмент в арсенал.

Что для своего обучения в Machine Learning и Deep Learning использую я?

🔤🔤🔤🔤🔤🔤

Открытые датасеты, решения других пользователей, можно что-то взять для себя, топовые соревнования

🔤🔤🔤🔤🔤🔤

Речь идёт про зарубежные форумы, на которых выкладываются различные решения по запросам пользователей. Скорее всего, на вашу проблему напарывались другие люди.

🔤🔤🔤🔤🔤🔤🔤

Promt-инженеры обрадовались. На самом деле, очень классный инструмент, которым нужно пользоваться здесь и сейчас. Пишем запросы и радуемся ответу чудо-машины, берём что-то для себя.

🗒 Например:

оценка качества модели для машинного обучения на примере…

зачем нужна кросс-валидация и т.д.

🔤🔤🔤🔤🔤

Не ЖПТ, просто чаты с реальными людьми. Цель - познакомиться с крутыми специалистами, влиться в сильное комьюнити и вместе развиваться.

🔤🔤🔤

Документация, конечно же. Сидим, практикуем английский, если есть вопросы, пишем в чатики и отправляем запрос в AI

😌 Использование этих инструментов в синергии, пока что, даёт какой-то космический буст, имхо

А как обучаетесь вы? Пишите в комментариях, ставьте реакции 🥺
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳24👍53🔥3🌚1
🔤🔤 🔤 🔤🔤 2️⃣🔤

Пошла вторая неделя моего изучения Machine Learning и Deep Learning.

😌 Потихоньку разбираюсь с метриками машинного обучения. В различных случаях использование одной метрики ничего не даёт. Например, accuracy в задаче классификации для дисбаланса классов. Узнал про то, как можно это пофиксить: например, с помощью over sampling и synthetic data

😏 Оказывается, GridSearch для поиска гиперпараметров - не панацея, работает очень медленно, если датасет большой или перебирать надо много. Лучше использовать другие инструменты для тюна (Optuna, например)

😳 Услышал про эмбеддинг товаров, начал копать в эту сторону. Word2vec (King - Man + Woman = Queen)

🤩 Готовлюсь к кейс-чемпионату по DS от Changellenge (заполняем GitHub)

🧐 Посмотрел пару задач на Kaggle, покрутил всеми любимый Titanic. Accuracy = 0.82 для логистической регрессии

🫠 Продолжаю плавиться в Deep Learning School и ИИ старт от МФТИ.

😦 Взял проект на работе по ML с предиктом уходящих пользователей, пока готовлю витрину данных.

В планах:

1️⃣ Установить и разобраться с AirFlow, DAGs

2️⃣ Продолжить ботать матан и линал для ML

3️⃣ Пройти курс по Docker для разворачивания ML-моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳28🔥53👍3👨‍💻3🏆1💋1