Заскуль питона (Data Science)
6.15K subscribers
110 photos
15 videos
4 files
142 links
Канал про Python, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Чат: https://t.iss.one/my_it_frogs
Download Telegram
Ну что ж, третьему посту по A/B быть 😘

Пока лягушонок пишет про материалы, накидайте реакций 🗒

А то.. админ уйдёт в небытие 😡
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓15👍2💩2🔥1
1️⃣ Первая часть материалов по A/B тестам

Лягушонок вернулся, чтобы поделиться с вами полезными материалами 🚶

Время постов про A/B тесты настало, пора погрузиться что ли с ног до головы, просматривая занимательные статьи, лекции и видосики. Так, в прошлых постах упоминалось про вводные моменты, но не было материалов по A/B в таком количестве, чтобы можно было сделать какие-то выжимки, но админ постарался этот момент решить 🗒

Здесь должна быть интеграция по типу:

🔥 мои кореша из карпов.курсес 🔥

Про проблемы подглядывания 😳
Мы всегда хотим, чтобы наше значение p-value было меньше ошибки первого рода, поэтому если по ходу эксперимента мы будем сидеть и смотреть за своими наблюдениями по дням, увидим стат. значимость и решим отключить A/B тест, склонившись в пользу тестовой группы, мы будем не правы.
link

Как и зачем оценивать размер выборки?
Освежить в памяти про мат. стат, понять, какие ошибки могут возникнуть при интерпретации результатов при A/B тесте
link

A/B тесты с метриками-отношениями и при чём здесь внутрипользовательские корреляции
На примере CTR показывается то, как мерить результаты экспериментов на примере t-test, Poisson bootstrap. Основные нюансы с метриками, показателями на примере Python.
link

Никита Маршалкин: А/Б тесты сложнее, чем кажется | Интервью
Тут деловой человек из 📱 рассказывает про то, как проводят A/B тесты, системы сплитования, проверку гипотез и много всего.
link

😀 Как же без моей любимой Яшки 😀

A/B тесты как способ развития продукта ☀️
Лекция про A/B, здесь можно глянуть основные метрики, как оценивать статистическую значимость.
link

Как провести A/B-тестирование: 6 простых шагов
Вводная по A/B тестам в виде короткой статьи, новичкам будет полезно.
link

Эффективное А Б тестирование - Виталий Полшков
Опять про Ratio-метрики (как CTR), ошибку дисбаланса классов при A/B, на основе которой мы можем принимать неправильные решения.
link

Как повысить чувствительность метрик - Илья Кацев
Доклад про то, как работает перевзвешивание в Яндексе, размножение списков, домножение на корень...
link

Советую подписаться на каналы 😀 по разработке, школы менеджеров, они лежат в открытом доступе и требуют вашего внимания
link_1
link_2

Друзья, стоит также упомянуть и про Experiment Fest (expf), с которыми сотрудничают 🔥, там очень много митов с разными компаниями, можно много для себя чего найти
link

Если вам такой формат постов зашел, жмакайте на реакции и вторая часть материалов не заставит себя долго ждать 🚶‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🐳42🔥1🍌1👨‍💻1
Вау, нас уже 500. Идём к следующему рубежу.

Сегодня поделюсь второй частью материалов по A/B и стате, вам понравится 🎲

Накидайте реакций пожилому лягушонку на этот пост 🎧
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍62
2️⃣ Вторая часть материалов по A/B тестам, первую можете глянуть туть

Про основные моменты по теории инфа туть и туть, а теперь к материалам.

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1
Разбиение выборок, основные определения, прокрас теста, t-test
, Манн-Уитни, A/A тесты, работа с метриками
link

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 2
Методы увеличения показателей, время проведения эксперимента, CUPED, Bootstrap, доверительные интервалы
link

Как устроено A/B тестирование в Авито 🥤
Этапы A/B тестов, основные сложности, дизайн, Ratio-метрики, визуализация
link

Матстат и питон
Препод вышки объясняет математическими симуляциями про ошибки, метрики, эффекты, на досуге можно глянуть.
Спойлер: Подойдет тем, у кого есть база по стате ну или тем, кто готовился к шаду 🛌
link

Computer Science Center
Очень много полезной инфы, лишним не будет
link

А теперь эксклюзивчик 🥇

У 🏦 есть много классных курсов, куда обычно сложно попасть, поскольку конкурс космический. Однако, полезное, что-то из этого могло получиться. Раз в какой-то промежуток времени становится доступен курс от тиньки по анализу данных в индустрии. Чтобы вам не приходилось ждать следующего потока, предлагаю сразу просмотреть основные моменты по Python.
link

Если вас и это не остановит, можете попробовать пройти курс для школьников от того же банка. Сертификат + тонус (но по уровню не очень жестко).
link

Ну, ладно, ладно. У 📦 будет митап 25-го числа по A/B тестам, можно зарегаться и прийти как онлайн, так и офлайн (18:00) в сити. Линк на регистрацию ниже.
link

Есть еще много полезных материалов, накидайте реакций и будет еще один пост по ним ⌚️

Пишите в комментариях, что бы вы бы хотели увидеть, а на этом всё. Админ пошел отдыхать 🚶‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥7
Channel name was changed to «Заскуль питона (DA/DS/ML) 🐸»
💞 Вы проделали хорошую работу по A/B тестам, давайте отдохнем и переключимся с A/B на SQL. Знание основных моментов позволит вам приблизиться к заветному офферу аналитика. Хотя, работа аналитика заключается не только в написании запросов SQL, хотя это тоже очень классно уметь.

В основном, предстоит работать с SELECT и писать запросы в уже существующую базу данных (ClickHouse, Oracle, PostgreSQL и др.). Сам по себе SQL несложный, но для перехода в IT-индустрию он нужен, как ни крути.

🍪🍪 Что спрашивают обычно на собеседованиях или что спрашивали меня?
> что будет, если заджойнить 2 таблицы, сколько строк выведет?
> какой запрос вернет большее количество строк?
> какими способами можно удалить дубликаты в таблице? (Спойлер: больше трёх)
> синтаксис, какие операции выполняются в начале. Может быть огорчу кого-то, SELECT в конце.
> решить продуктовую задачу, определить n-day Reteniton и другое.

💡 Если у вас есть какие-то проблемы с этим, советую ознакомиться с источниками, которые прикреплю ниже по степени приоритезации.
> 🔥 симулятор SQL от karpov.courses - все структурированно, хорошие лекции и задачи. С 30 января будут доступны продуктовые задачи (по типу расчета Churn Rate, Retention, возможно) + можно попрактиковаться в Redash. Визуализация + запросы.
> доисторический тренажер, советуют в том числе и крупные компании, такие как 🏦. Много разных задач, после прохождения будете щелкать задачки на раз-два.
> тренажер на stepik. В свое время он помог структурировать знания и попрактиковаться. Спойлер: оконных функций нет, что печально.
> sql-academy. Много задач, наткнулся по советам 📦, когда готовился к стажке.

Когда вы прошерстите хотя бы первые два. Поймете про подзапросы, группировки, JOIN и оконные функции, можно приступать к решению задач с собесов крупных компаний.
> itresume - задачи отфильтрованы по сложности, можно выбрать для себя некоторые и порешать, например в альфу. Доступ к премиуму можно получить за приглашение друга, надеюсь, вы знаете как это можно заабузить.
> stratascratch [EN] - 500+ interview coding questions (Facebook, Google, Microsoft, twitch).
> datalemur [EN] - то же, что и stratascratch, можно встретить другие задачи.

Накидайте 40 реакций на пост и выйдет следующая часть по A/B тестам, если вы, конечно же, этого хотите 😡
Please open Telegram to view this post
VIEW IN TELEGRAM
32🐳7👍4🔥2
⚽️ Следующий пост будет про Excel, для стажёров маст-хев.

Ставьте 👍🏽, чтобы пост вышел быстрее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53💩3
Всем привет, как и обещал, пост про Excel

Вообще, приходится сталкиваться с работой в нём, но самое главное, что обычно взаимодействие с ним выглядит для стажёров 💼 следующим образом:
> выгрузи данные из БД.
> сформируй дешборд, сводную таблицу.
> сделай выводы.

В некоторых компаниях может возникать проблема, что данные хранятся в нескольких БД, поэтому выгрузка запросов из каждой БД и дальнейшие действия в Excel могут решить эту проблему.

✏️ Важно:
> понимать то, для чего делаются те или иные функции.
> быстро и правильно проводить вычисления.
> уметь найти ошибку в формуле.

🎩 Основные функции, которые применяются на работе и которые были на стажке 📦:
>
ВПР, ГПР - по сути тот же JOIN, который мы используем в SQL (более подробно по SQL можно глянуть туть).
документация
> ЕСЛИ - условие, по которому мы определяем соответствие значения. Условно, если элемент такой, выведи одно, иначе - другое.
документация
> СЧЁТЕСЛИ, СУММЕСЛИ - складывают / считают значения при каком-то условии. Например, нам из таблиц по странам нужно вывести объем продаж по России.
документация
> СЦЕП / СЦЕПИТЬ - та же функция CONCAT (объединяет строки).
документация
> ИНДЕКС в сочетании с ПОИСКПОЗ. Суть заключается в том, что такой синтаксис позволяет джойнить по нескольким столбцам. Например, из таблицы с объемом продаж по странам у нас есть также города. Нужно вывести объем продаж по конкретному городу (при условии того, что названия городов могут повторятся в разных странах).
почитать можно тут

🫣 Конечно, это не весь список, но работодатели хотят видеть именно то, что вы умеете работать с данными функциями и понимаете для чего они нужны. Также стоит отметить, что все не ограничивается формулами, есть также и визуализация, форматирование и др. Про вещи, связанные с закреплением строк, типичных операций по типу СУММ, СУММПРОИЗВ и др. здесь не будет. Если рассматриваете Excel с нуля, советую глянуть следующие материалы.

> курс от Яндекс по Excel
> курс от Альфы - сводные таблицы, группировки данных и многое другое

➡️ Тестовые датасеты можно посмотреть на kaggle, можно выгрузить в csv, запихнуть в Excel и покрутить на реальных данных, попробовать сделать дешборд, сводные таблицы.

[EN] Можно глянуть crash-course по Excel на английском языке (6 часов), если дойдут у вас руки. Ссылка тут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🐳42🤮1🥱1
💼 Почему ходить на собеседования важно?

Привет, мир, сегодня я хочу затронуть одну из самых важных тем, касаемую собесов. Будучи трудоустроенным, я продолжаю ходить по различным компаниям, чтобы…

📈 Очевидно, это получение более сочного оффера. Это само собой, вопрос о самореализации.

Но основная цель заключается не в этом.

🫣 Когда я только начал погружаться в IT, аналитику, хотелось устроиться на место, где буду решать классные задачи, грейдиться в профессиональном плане.

Сейчас это мне нужно для того, чтобы:

> быть в тонусе, чтобы легко решать задачки на собесе
> чувствовать себя уверенно и внушить себе, что это очередной мит
> понимать тренды в компаниях.

Например:
🏦 - преимущественно офис 5/2, 2-3 этапа.
🏦 - берут людей из вышки, бомонки, мгу, мфти, остальные не попадают под ключевики. Если попали, повезло.
📦 - перешли на SuperSet (BI-система), поэтому можно для себя глянуть этот инструмент и владеть им.
📱 - 4 этапа, классика практически на любой вакансии.
📱 - отдельные структуры придерживаются таких же этапов , что и Яндекс, поскольку вышли относительно недавно.

😱 Раньше было очень страшно общаться с HR, рекрутерами, однако, сейчас чувствуешь себя более расслаблено и нет какой-то тревоги.

Вывод:

Ходите на собеседования и не бойтесь HR, они не откусят вам голову

Накидайте 🐳, если вам понравился такого рода пост, всем продуктивных выходных!
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳73🔥43👨‍💻2👍1🤮1
Ура, нас уже 600, я в шоке! 💼

Спасибо, что продолжаете следить за новостями, именно вы заставляете писать посты, придумывать что-то новое, делиться опытом. Всех люблю 🐸
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳206🔥3🤩1🌭1💅1
Как перестать бесконечно учиться и получить заветный оффер?

Согласитесь
, у вас было такое, что продолжали решать типичные задачи с различных тренажеров, видео, слитых или нет курсов, в надежде на то, что это повлияет на вас как-то профессионально (больше опыта, навыков, работодатели точно оторвут с руками и непонятно где потолок). 🤵

😣 Боюсь вас обрадовать или огорчить, постоянное обучение без практики - не есть хорошо, а вы, не будучи уверенными в себе, попадаете в ловушку бесконечной учебы и не понимаете, когда же настанет тот момент, когда вы станете топ-специалистом. Спойлер: только практика. Но как это делать правильно, чтобы все-таки получить оффер и понять с какими задачами предстоит столкнуться?

😌 В мире Data Science существует большое множество теории, но охватить всё невозможно. Единственный вариант - в один момент себе сказать: "Пора работать, я знаю достаточно!" Да, звучит весьма специфично, что-то в роде инфоцыганства. Однако, кто знает, что вы хотите устроиться на работу? Только вы!

Лишь походив по собесам, я понял где находится потолок на каждой из вакансий (по знаниям, которые вы в теории можете получить). От привычного SQL, Python, EDA, тервера и статы до ML, анализа текстов и др. Прикольно понимать то, что вам нужно подтянуть под конкретную компанию. Первое время стараешься угнаться за оффером, а потом ходишь и подтягиваешь то, что у тебя не получается.

🍪🍪 Например, как было у меня:

Одним из моих первых собесов был 📱 на позицию Product Analyst. Меня попросили рассчитать Retention 5-го дня в SQL (на то время, я не знал, как сделать это корректно). И начиная с этого собеса я начал копать в сторону продуктовых метрик и их расчета. В 📦 на Middle Product Analyst дали тестовое задание с генерацией распределений и расчетом метрик, понял, что это важно (например, для A/B тестов). Ещё в 🏦🏦 понял, что нужно копать в сторону статистики и знаете, даже как-то подсел на подобного рода вещи.

Я не говорю про тех, кто сейчас усердно работает и подтягивает знания из разных отраслей, те же миты, встречи, курсы, это всё ок. Речь идет про тех, кто не может остановиться учиться и не понимает где же потолок. Выяснить это можно, общаясь с тимлидами, HR, раскидывая резюме как на hh, careerspace, jobby, так и на сайтах компании работодателя 🥂

Но что же делать человеку без опыта и как перестать получать 100% отказы?

Если на посте наберется 100 🐳, расскажу про это более подробно.

P.S: Админу нужно время
🎩
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳187👍10👎21👨‍💻1
Как получать меньший процент отказов и стать котируемым на рынке?

Или как получить опыт без опыта?

Вот вы ботаете очередной курс, читаете книги, смотрите задания по матеше и решили, что надо пойти работать. Вполне здравая мысль, когда человек задумывается о самореализации. Но вот незадача, на работе, оказывается, нужен опыт 🧢

Всё, выхода нет, нужно продолжать учиться, опять лягушонок несет очередную дичь. Однако, выход всё же есть, не стоит расстраиваться 🔥

1. Стажировки.

Достаточно классный буст в бигтех компании. Компании в течение года набирают стажеров, а также проводят массовый набор в рамках специальных ивентов.

🏦 Тинькофф
️ Future Today
📦 OZON
🏦 SberSeasons
📱 Яндекс
📱 VK

2. Хакатоны / Кейс-чемпионаты.

😂 Подходит не только для студентов + можно упаковать в опыт, если мы говорим про такие вещи, как Python, SQL, BI, метрики и др. Звучит весьма интересно, поскольку не обязательно выигрывать, главное покрутить данные, получить необходимые знания. Конечно же, можно шлифовать различными курсами, чтобы по знаниям было все более-менее структурированно. Кроме того, нетворкинг, который очень сильно решает.

Ближайшие мероприятия:

📱 MTC ML CUP (уже идёт, можно регистрироваться)
Молодежный бит от РосМолодёжи, хакатон (17-19 февраля. Регистрация до 14 февраля). Направления: Аналитика, дэшборды, Web
AeroSpacePro, хакатон (28 февраля - 18 апреля. Регистрация до 26 февраля).

Достаточно не густо пока что. Можно отслеживать тут 👧

3. Kaggle.

Находка для ML-специалистов и DS. Очень много датасетов, можно участвовать в соревнованиях, а потом в резюме указать, что вы Kaggle Grandmaster
> A/B тесты
> Модели, ML
> EDA и многое другое 📸

4. Pet-Projects.
Собственные проекты, которые вы расцениваете как хобби. Это может быть и написание телеграм-бота, крипто-бота, калькулятора, что угодно. Суть в том, что вы скидываете это на GitHub, коммитите ветки и показываете работодателю, что долго и усердно работали над чем-то ☕️
Статья_1
Пример GitHub с Pet-проектами

5. Расширение деловых контактов.
Да, это тоже важно. Посещение различных митов, добавление контактов в линкедине, общение в чатиках тоже влияет. Когда с вами делятся опытом, это очень классно + вы начинаете глубже понимать специфику того, чем занимаются другие 🤵

6* Прохождение курсов с практикой.

Зачастую эти
курсы платные, но дают классный опыт. Например, Яндекс.Практикум 📱 или karpov.courses 🔥

🚪 Этот список может продолжаться до бесконечности. Тот же фриланс, подработки и прочее. Как мне кажется, здесь выделил основные моменты, которые сократят количество отказов и помогут получить опыт без опыта.

Давайте попробуем набрать 150 🐳, если вам понравился пост и я обещаю выпустить что-то интересное
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳130👍8💅2
Решил удалить обсуждение, в итоге комменты слетели, bruh…

Решил возродить чатик

Пишите свои вопросы сюда 🤵
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡13👎2🤯2🌚2😭2
Как перестать разочаровываться во всем и начать жить?

Всем привет, в
этом посте я накидаю мыслей про выгорание и расскажу про то, что делать с этим ☕️

Когда вы только начинаете искать предназначение в жизни, руки могут опускаться по ряду причин 👀

> Очень много конкурентов. Уже есть десятки тысяч классных специалистов, чем они хуже меня? Про это будет написано ниже.

> Знания, которые я получаю не дают того эффекта, который я изначально закладывал для себя.

> Работа превращается в день сурка и теряется смысл от того, что я делаю.

Когда я учился в школе, думал, что в IT итак много специалистов, поэтому поступал в ВУЗ по обществознанию. Скорее, здесь про уверенность в себе, ты не готов разобраться в структуре рынков, а у тебя внутри есть какой-то барьер 🔥

Начиная развиваться в IT, я перестал завидовать успеху других людей, даже если они достигли его в раннем возрасте. У них свой путь, у меня свой… На первое время я перестал смотреть на достижения окружающих людей, чтобы не тильтовать лишний раз. Потом постепенно начал интересоваться тем, чем занимаются «коллеги по несчастью», чтобы расширить кругозор, барьер преодолён 😮

Вот смотришь курсы, полезные материалы и в один момент понимаешь, что профита никакого нет. Да, это звучит весьма нормально, ты стоишь на месте и не можешь получить нормальный оффер. Я всегда был категоричен к себе и не давал себе отдохнуть, покручивая датасеты, смотря документацию, и в один прекрасный момент меня начало воротить от того, чем я занимаюсь. От того, что вы выделите себе время для отдыха, не будет хуже, а выгореть будет сложнее (для меня это тяжело, поскольку отдыхать нормально я не умею и лишний раз хочется прогрейдиться в короткое время) 😢

Но вот, свершилось чудо и вы получили оффер, но, проработав какое-то время, понимаете, что работа превратилась в рутину, а интерес пропал. Да, такое тоже бывает, нужно уже на стадии обучения понимать, что какие-то вещи будут привычными и ежедневными, однако, выход есть. Можете поговорить с руководителем и узнать, будут ли задачи, которые вам будут интересны. Если понимаете, что нет, советую походить по собеседованиям, кстати, пост можете глянуть тут 👧

Делитесь своей историей и тем, как вы боролись с выгоранием, будет интересно почитать.

Давайте наберём 150 🐳 и в следующем посте я расскажу про свой путь в IT 🧃
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳106👍62🤨1
Друзья, всем привет!

Мои кореша из 🔥, точнее их Content creator Симулятора ML организует митап, на котором с вами поделится различными лайфхаками, как сделать свой пет-проект и как войти в айти без опыта (это не всё).

💼 Дата проведения: 16 февраля, 19:00

📸 Формат: Оффлайн, РЭУ им. Г.В. Плеханова (г. Москва)
📍Стремянный переулок, дом 36
UPD: по возможности выкатят запись.

Приходите, будем ждать 🚪

Ссылка на регистрацию
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳22👍7🤩2
Думаю сделать пост с задачами, которые попадались на позициях Data Analyst, Product Analyst в 😀, 🏦, 📱, 📦

Накидайте реакций, если эта тема вам интересна 😇
Please open Telegram to view this post
VIEW IN TELEGRAM
👍152🐳40🔥8🦄743😍2💘2🥰1🤯1🎉1
1️⃣0️⃣0️⃣0️⃣❗️

Исторический момент, друзья. Спасибо, что
остаётесь со мной. Напишите, чего бы хотели видеть на канале в будущем 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳52🦄42🔥2😱2🎉2😍21🤯1🤩1🌭1
Всем привет, в этом посте поделюсь задачами с различных собесов. Здесь буду кратко резюмировать то, что реально было на собесах, в тестовых заданиях 🧐

📦 OZON

👩‍💻 Задание на Python (pandas, numpy, знание функций, циклов, визуализаций, распределений)
> обработка данных
> агрегирующие функции
> удаление выбросов.
> визуализация

Например: нужно было сгенерировать user_id из цифр и букв длиной 15, при этом это должно экстраполироваться на 10000 строк 😏

👩‍💻 Задание на SQL (тетрис). Оконные функции, превращение «узкой» таблицы в «широкую», подзапросы, JOIN

Логика, тервер, стата, здравствуйте 💪

😀 Яндекс

📞 На первом созвоне с HR дали тервер для того, чтобы быстро понять, нужен ты им или нет.

Ну и вопрос на подумать:
Когда продавцу на Яндекс.Маркете выгодней всего продавать товар ниже себестоимости? Ответы пишите в комментариях 😬

📞 Второй созвон - теория вероятностей и математическая статистика. Поговорили про основные моменты, связанные с определением Sample Size через MDE, когда вариант A/B надо катить в прод и как выбрать систему сплитования, если на разработку даётся 2 дня. Если мы говорим про тервер, это типичные задачи на шарики с ящиками, условные вероятности, Байес и другие.

📞 Третий созвон -
алгоритмическая секция. Наводит ужас, не правда ли?

👩‍💻 Задача уровня LeetCode medium+

👩‍💻 Задача на оконные функции, не помню уже условия, но суть такая, что у нас есть таблица, которая имеет следующий вид:

id - int
time - int
value - varchar

Если мы видим пропуск в value (NULL) заполнить ненулевым значением, которое встречалось в партиции в сортированной таблице.

В конце поговорили про A/B тесты, различные сложности, которые могут возникать и другое.

🏦 Если вдруг решили устроиться 5/2 офис, мы вас ждём.

📞 Первый созвон

Больше про продуктовое мышление, дали кейс, по которому нужно было выбрать относительные метрики, как можно будет отдавать для разработки дешбордов.

📞 Второй созвон

👩‍💻 Из разряда, что выведет код, List comprehensions, функции, строки, словари. В библиотеки не залезали

👩‍💻 Какая ошибка в запросе, что выведет запрос

> нет группировки
> ошибка в JOIN и др.

Ну, конечно же, куда без тервера и шариков 😬

😶 Вывод:

Если хотите в Яндекс, решайте алгоритмические задачи на LeetCode, находите оптимальные решения, потому что зачастую спрашивают следующее: а можно как-то проще, чтобы сложность понизить? Не забываем про статистику и тервер, конечно же 😱

Если хотите в OZON, решайте более прикладные задачи, играйте с библиотеками, SQL, благо сейчас ресурсов тонны 🤤

Если хотите в Сбер, также решайте прикладные задачи, но не упарываясь в оптимизацию, также и с SQL 🫠

😍 В честь праздника, ловите небольшой подгон в виде самих заданий (часть из них удалось сохранить). Ссылка тут

Накидайте реакций, если понравился пост, и увидимся уже на митапе по ML в плешке (16 февраля) 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
82🔥21🐳15👍11🌚2🌭2❤‍🔥1🤯1😍1
Начал писать пост про Road-Map для Junior/Intern Data-Analyst 😱

Расскажу про:
🤔 Основные инструменты, hard-skills

🤩 Как бы я выстраивал план обучения сейчас

😅 Расскажу про то, как можно найти первую работу

🛍 Ну и расскажу про планы на будущее, в каком направлении хочу двигаться.

🚗 Накидайте реакций, если эта тема вам интересна. Пишите комментарии, что бы хотели видеть по данной тематике
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳14717👍12😍5🔥43🕊3🦄3💘2🎉1🌚1
🥪 ROAD-MAP DATA ANALYST

Hello World
, в сегодняшнем посте хочу рассказать про HARD-скиллы, которые помогут вам стать запакованным стажером / джуном дата-аналитиком. Да, тема достаточно заезженная, но можно составить какую-то Road-Map для этого. Хочу максимально разжевать это, чтобы было какое-то понимание. Вот, вы решили стать DA, потому что это достаточно перспективное направление. Окей, все классно, но с чего же начать?

🤤 P.S: я хочу выстроить план на основе того, через что мне предстояло пройти. Волшебной таблетки нет.

Какой же «Истинный» пак дата-аналитика?

👩‍💻 Python (pandas, numpy, matplotlib, based functions in python)
👩‍💻 SQL (оконные функции, джойны, группировки, подзапросы, работа с таблицами)
😎 BI-System (визуализация, дешборды, адаптация скриптов)
🤓 Probability theory and statistics (условная вероятность, ЦПТ, доверительные интервалы, проверка гипотез, распределения и др.)
📱 Google Searching (да, полезный навык, который сократит время ожидания ответа от других пользователей, любителям nometa.xyz привет)
🧑‍🎓 Product metrics, business thinking (понимание для чего вы проводите те или иные расчеты, какую пользу вы несете бизнесу / продукты, упор на метрики)
🔒 Excel*. Запрашивают на стажировках, иногда используется для выгрузки отчетов, создания сводных таблиц.

В какой же последовательности я бы изучал сейчас?

0️⃣ Google Searching

Казалось бы, зачем это всё надо? Оперативно найти вопрос по интересующей вас теме на зарубежных форумах и не тратить своё время и время других на решение какой-то проблемы. Сейчас так вообще, можно забить всё в ChatGPT и решить конкретную задачу. Здесь речь идет скорее про то, что гуглить - это важно и в этом нет ничего такого.

1️⃣ SQL

В целом, похож на pandas (Python library), выстроенная структура поможет быстро адаптироваться под Python и начать работать с реальными данными. Номер один сейчас, имхо - это 🔥, там есть и работа с SQL, а также работа с дешбордами и продуктовыми метриками, очень крутой курс. Окей, мы научились пользоваться оконными функциями, подзапросами, джойнами. Но аналитик - это не тот, кто пишет только SQL-запросы, не правда ли?

2️⃣ Default Python
Окей, мы продвинулись дальше, на очереди Python. Его нужно знать хорошо, чтобы писать функции и применять к конкретным переменным, понимать работу циклов, работу со словарями, строками, списками. Здесь можно без ООП, нам нужно быстро прогнать теорию и научиться реализовывать это на практике. Есть классный 👩‍💻 от ODS и Игоря Котенкова, всё достаточно классно разжевано, советую посмотреть.

3️⃣Probability Theory and statistics + Python
Далее, математическая статистика и теория вероятностей. Предлагаю совместить это с Python, поскольку голая теория по этим двум дисциплинам очень плохо запоминается, а практика важна. Предлагаю начать со статистики и теории вероятностей на Stepik. Ранее, я скидывал тестовое разных компаний, можно глянуть тут. Сгенерировать свои данные и посмотреть как это реально может работать, понимать распределения, описание статистики + подкрепить A/B тестами, если хотите. Можно посмотреть вот этот мини-курс, чтобы понять как статистика и теория вероятностей работает в Python.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳23👍12❤‍🔥42👏2💘1
4️⃣BI-Systems
В основном, это средство визуализации, построение дешбордов, но на 1 шаге, мы уже их строили, более глубже можно узнать, посмотрев курс тут. Друг на друга они в целом похоже, поэтому выбрать BI-систему для изучения - не так важно.

Но зачем в итоге нужны аналитики, почему не может всех заменить OpenAI? Во-первых, кто будет составлять запросы для ИИ? Во-вторых, кто понимает специфику бизнеса и интерпретацию различных метрик?

5️⃣Business and product thinking
Понимание этого помогает вам и компании, в которой вы работаете, расти. Однотипные выгрузки, преобразования данных без формулирования выводов не нужно. Мы должны видеть, где проблемы в нашем продукте, чтобы впоследствии можно было принять решение по его дальнейшему развитию. Тренажер для погружения в продакт-менеджмент

6️⃣*️⃣Excel
Если вдруг понимаете, что вам это нужно (для стажировки, работы), "ботается" за 3-4 дня. Курс по Excel c практикой

🏋️ Как же набрать опыт?
Ну, без опыта вас не берут на работу, а без работы у вас нет опыта. Всё, жизнь, ужасна. Посмотрите мой предыдущий пост, там написаны основные пути решения. Упакуйте участие в каких-либо проектах как релевантный опыт. Зачастую HR смотрят на стек, что вы делали на работе, а также стаж.

🛍 А теперь, что же у меня по планам?
Хочу провести эксперимент над собой и запустить формат марафона по Machine Learning, Deep Learning, где буду делиться тем, как продвигается обучение, что смотрю. Начинаю с относительного нуля, но есть желание в этом разобраться. Пишите комментарии, интересно ли это будет вам.

👍 Ставьте реакции, если пост понравился

По Hard-скиллам можете также посмотреть у моего друга с канала
Блог о Data Science, ссылка на пост тут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🐳177❤‍🔥4