Заскуль питона (Data Science)
6.16K subscribers
110 photos
15 videos
4 files
142 links
Канал про Python, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Чат: https://t.iss.one/my_it_frogs
Download Telegram
🔤🔤 🔤 🔤🔤 2️⃣🔤

Пошла вторая неделя моего изучения Machine Learning и Deep Learning.

😌 Потихоньку разбираюсь с метриками машинного обучения. В различных случаях использование одной метрики ничего не даёт. Например, accuracy в задаче классификации для дисбаланса классов. Узнал про то, как можно это пофиксить: например, с помощью over sampling и synthetic data

😏 Оказывается, GridSearch для поиска гиперпараметров - не панацея, работает очень медленно, если датасет большой или перебирать надо много. Лучше использовать другие инструменты для тюна (Optuna, например)

😳 Услышал про эмбеддинг товаров, начал копать в эту сторону. Word2vec (King - Man + Woman = Queen)

🤩 Готовлюсь к кейс-чемпионату по DS от Changellenge (заполняем GitHub)

🧐 Посмотрел пару задач на Kaggle, покрутил всеми любимый Titanic. Accuracy = 0.82 для логистической регрессии

🫠 Продолжаю плавиться в Deep Learning School и ИИ старт от МФТИ.

😦 Взял проект на работе по ML с предиктом уходящих пользователей, пока готовлю витрину данных.

В планах:

1️⃣ Установить и разобраться с AirFlow, DAGs

2️⃣ Продолжить ботать матан и линал для ML

3️⃣ Пройти курс по Docker для разворачивания ML-моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳28🔥53👍3👨‍💻3🏆1💋1
🔤🔤🔤🔤 🔤🔤🔤🔤🔤

На днях я начал задумываться над тем, что ждет всё айти в течение десятилетия. Возможно, все будем жить без еды, кто-то выберет путь наименьшего сопротивления и уйдет в небытие 😐

Ужаснула мысль о том, что с выходом ChatGPT и других AI продуктов в свет, можно по-разному с этим играться. Например, создать платформу, которая будет выступать в роли консалтинга и находить какие-то зависимости в данных и подстраиваться под каждый бизнес. Безусловно, здесь должна идти речь о какой-то конфиденциальности, поскольку никто не хочет в очередной раз видеть слитый ГИТ на 42 гб, как в Яндексе 😈

Интересно вообще понимать, может ли данная платформа, если она будет существовать, разорить бедных аналитиков и тех, кто просто пишет запросики в БД. Что же тогда будет с рынком? Пока неясно 😶

Как на основе каких-то нейросетей, которые обучаются на примерах, например, ищут инсайты в данных и являются promt-инженерами, можно выстроить эффективную работу и реализацию поставленных задач внутри компании? Не могут же уйти просто менеджеры, лиды, ведь именно они занимаются постановкой задач, которые необходимы бизнесу в настоящее время. Возможно, нас будет ждать нечто страшное, способное подстраиваться под любой бизнес и обучаться, спустя какое-то время, возможно, всех не станет 🔒

Безусловно, сейчас мы имеем работу с инструментами, которые позволяют в кратчайшие сроки обучаться и искать новую информацию. А что, если вместо этого будет сидеть AI, который будет подстраиваться под данные компаний (если возможно это будет сделать максимально безопасным) и в зависимости от этого, парсинга предстоящих мероприятий, например, будет продумывать решения и закидывать их в ChatGPT или обучаться на них 🏋️

А что думаете вы по этому поводу? Пишите в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳7😢21👎1
Atomic Heart в реальности?

Всем привет, в этом посте напишу о том, как решил спринтануть ML, чем я пользовался и к чему вообще пришёл. Оговорюсь сразу, мой марафон не закончился 🤓

Представьте, у вас есть волшебная таблетка, проглотив которую вы получаете сразу знания по любой интересующей вас области: ML, DA, DE, DL и др.
Согласитесь, это достаточно круто, ведь можно значительно сократить время 🏋️

Прикольная штука, но пока у нас нет подобных технологий, жаль. Ну, приходится довольствоваться тем, что имеем 🙆

Вдохновившись тем, что ML, нейронные сети - крутое направление, вписался в различные курсы такие, как:

> Deep Learning School от МФТИ
> REU ML School
> ИИ старт от МФТИ
> Основы машинного обучения от ВШЭ
> Основы Data Science и машинное обучение


Используя ChatGPT и параллельно просматривая документацию, курсы, ноутбуки на Kaggle, видео на английском от индусов, я продолжал наращивать свои знания по этому направлению. Я даже составлял RoadMap’у для себя, ну и конечно же, сформировал базу знаний, основываясь на структуре различных курсов 🧑‍🎓

Что посмотрел за 3 недели?

Градиентные спуски, Scalers, Encoders, эмбединги, A/B тесты, алгоритмы, перцептроны, линейные и нелинейные модели, кросс-валидация и сплитование, нейросетки, различные лайфхаки кеглеров, работа с дисбалансом классов, бустинги, сокращение размерности, EDA для моделей, тюн моделей и подбор гиперпараметров, скоры для оценки моделей, кластеризация (из Unsupervised) и многое другое 😬

Конечно же, не в совершенстве, я же не ИИ, я лягушонок. Думал и думаю перейти к NLP и CV 😶

Вообще, к чему я веду. Если вы думаете, что всемогущи и можете заботать что-то без базы, вэлком в мой мир. Делаю week-off по ML, готовлюсь морально к чемпионату по DS 🔒

В сжатые сроки можно все выучить, понимать полезность действий для бизнеса, но смотрите на моральное состояние, а то, возможно, превратитесь в уголь 😈

Накидайте реакций на этот пост, делитесь историей своего обучения, пока пойду отдохну на собесах 🎁

P.S:
Обещаю вернутся с чем-то интересным для вас 😘
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳38👍124🔥1
Дорогие девушки, от имени лягушки-аналитика, поздравляю вас с Международным женским днём!

Хочу пожелать вам невероятных успехов в нашей общей страсти - Data Science! Не останавливайтесь на достигнутом, следите за новыми открытиями и не бойтесь экспериментировать 🙅

Ведь именно благодаря вашей интуиции и креативности в Data Science можно достичь уникальных результатов. Пусть ваше знание Python, SQL и других аналитических инструментов всегда помогает вам решать сложнейшие аналитические задачи и приводит к блестящим результатам! 🤩

Хочу пожелать вам всегда оставаться улыбчивыми и позитивными, ведь ваше настроение и энергия – это то, что заставляет нас вдохновляться и двигаться вперед. Желаю вам не только успешных и точных дешбордов, но и тех, которые будут не только информативными, но и красивыми 😘

А ваше умение проводить классные A/B эксперименты – это несомненно круто. Пусть выборка всегда будет репрезентативной, а метрики – прекрасными, такими же, как и вы! 😘

Пусть Accuracy (то, как вы точно знаете, как сделать мир лучше),
Precision (ваше остроумие), Recall (ваша забота) и F1-Score (ваш женский инстинкт) были всегда на высоте и стремились к 1 😸
Please open Telegram to view this post
VIEW IN TELEGRAM
44👍8🥰4🐳2🤝1🫡1😘1
Почему нужно вписываться во все IT-инициативы?

Привет всем, в этом посте я расскажу о том, почему важно участвовать во всяких кейс-чемпионатах, хакатонах и прочей DS-движухе 💼

Я поучаствовал в немалом количестве чемпионатов, где-то даже занимал призовые места, привет 💙. Треки были посвящены маркетингу, продвижению продукта. Вроде бы классно, однако, несмотря на то, что твоя идея могла решить проблему, ты все равно оставался недопонятым жюри, что печально. Есть специализированные кейс-школы, которые обучают по шаблонам как нужно решать задачи, оформлять презы, нет какой-то своей изюминки, а мыслишь ты абстрактными понятиями, которые непонятно откуда рождаются в твоей голове 🤔

Мой путь в аналитике начался с Хакатона, который длился 7 месяцев. Казалось бы, что очень много, но за это время можно было предложить столько гипотез, так покрутить данные, чтобы максимально быстро влиться в то, чем занимаются аналитики 🍴

P.S: Была проблема с GPU, пришлось выкручиваться, залутал за хакатон money

Сейчас я работаю аналитиком и хочу подтянуть Machine Learning и Deep Learning для расширения кругозора и возможной переквалификации 😎

Для этого я участвую в кейс-чемпионате по Data Science, задача связана с NLP, Machine Learning 💃

Команда, кстати, называется «Заскуль Карпова»

Прохожу большое количество курсов, чтобы максимально быстро можно выйти на нормальный уровень в области ML, DL 🍷

Это значительно бустит вас, поскольку вы работаете с реальными инструментами в области DS, а не крутите условные игрушечные данные и джойните таблички 😮

Но как выжить в таком хаосе? Узнаем чуть позже 😨

Накидайте реакций, а я напишу про то, как мы решаем кейс-чемпионат, к чему пришли и какие инсайты нашли в предложенных данных 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳44👍124🔥3
Возвращение короля текстов или как 5 аналитиков решали NLP 🤴

История о том, как я с командой участвовал в соревнованиях по Data Science (NLP). Расскажу о трудностях и о том, к чему пришли.

Относительно недавно я начал ботать DL / ML и решил, а почему бы не поучаствовать в NLP. Раскидали задачи и начали активно работать.

Основная задача - алгоритм ранжирования комментариев под текстом публикации.

Изначально, я думал, что речь идет по RecSys, как с карточками на маркетплейсах, когда вам предлагают похожие товары, но пока не будем про это 😢

Первый этап: EDA

Похоже на танцы с бубном и поиск зависимостей в данных. Было выделено несколько фич: количество стоп-слов, слов, предложений, читабельность, тональность и кучу других.

Какие инсайты получили?

Длина текста, определенная тональность и наличие других символов определяют Score на размеченных данных. Дисбаланса классов не было, к over_sampling не приходили 🤨

Второй этап: Обработка текста
Стеминг, лемматизация, создание эмбедингов (Word2Vec, TF-IDF, BERT, CountVectorizer), удаление знаков препинания (прикреплю классный слайд с презентации, который нашел на просторах GitHub). «Мешок слов» не использовали, потому что получается матрица, которая сжирает 1 терабайт памяти 😢

Третий этап:

Перебор сочетаний с Logistic Regression, KNN, RandomForest, GradientBoosting. Самый лучший NDCG Score = 0,92. При обработке через BERT, возможно, получили бы результат лучше. Имеем, что имеем, ждём результатов 🍷

Накидайте реакций, а я накачу пост про Deep Learning, а то немного выбился из режима 🗒
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳352❤‍🔥2👍2👾2😎1
Продолжаем 😘
P.S: 10-е место.
Увидимся в финале на презенташке)
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳33👍7🔥63
😤 Ну что ж, закончились соревнования по Data Science. В целом, эмоции неоднозначные, но это были мои первые соревнования, хоть какие-то.

🔥 5 место

Далее буду участвовать на Kaggle, раскачиваться в RecSys, CV, NLP, возможно поучаствовать в Хакатоне от Вышки

По планам параллельно заботать алгоритмы, сами понимаете для чего 🤐

🍴 Пишите, что бы вы хотели увидеть в следующих постах, а я пока настроюсь на подкастик от @redpf, который пройдёт в это воскресенье в 20:00. Ссылка на пост
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🐳43🔥2👾2
Всем привет, я вернулся из небытия и готов поделиться с вами над чем я работаю и какой вектор развития у меня сейчас 😬

Прошел уже второй месяц моего участия в Симулятор ML от 🔥. Отдельное спасибо @uberkinder за этот продукт. Спойлер: Прошел чуть больше 50% + взялся за проект 😘

Сейчас у меня висит оффер от 💙 на позицию дата-аналитика, но хочу уйти в Machine Learning Engineering 😎

Над чем работаю сейчас?

> RecSys. Недавно была защита проектов для прохождения в магистратуру ИТМО, очень понравилась концепция и реализация @redpf. Более подробно можете ознакомиться в этом посте

> A/B Testing. Планирую заняться разработкой платформы, для этого думаю взять курс по A/B тестам у тех же 🔥

> В следующем году буду пробовать в ШАД от 😀 или AI Masters от 💙, поэтому готовлюсь к созданию коммьюнити тех, кому это будет интересно.

Давайте наберём n-ное количество реакций, а я расскажу про то, как сходил на собеседования в различные компании: Avito, Ozon, MTC, Yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103🐳1810🍌2👍1
Собеседования или история о том, как Максим получил оффер в OZON 💙

Всем привет, в этом посте я расскажу о том, через какие вопросы на собеседованиях я прошел и компании, которые остались в моем сердечке навсегда 😘

Первую часть поста можете посмотреть тут

Многое поменялось с тех времен, однако, я добился того, чего хотел 😬

❤️ AVITO
Все проходят одинаковый набор на аналитиков данных. По сути процесс отбора кандидатов проходит следующим образом: ты собесишься по общим правилам, общему стеку и дальше команды занимаются продажей себя на общей встрече.

🚶‍♂️ Первый этап: созвон с HR, обсуждение того, над чем работал, первичный скрининг.

😐 Второй этап: созвон с аналитиком, решение задач по статистике и теории вероятностей. p-value, распределения, матожидание. Ранее я делал подборку, где можно углубиться по знаниям данных дисциплин.

😘 Третий этап: созвон с лидом одного из направлений + аналитика. Бизнес-кейсы, гипотезы, SQL + Python.

😮 Вопрос: У нас есть определение геопозиции на сайте. К нам приходит лид и говорит, что нужно улучшить качество клиентского сервиса, что будем делать?

Как плюс: это классный фидбек, который указывает на твои ошибки и над чем стоит поработать!

❤️ OZON
Аналогичный отбор, иду в направление СНГ.

🤨 Вопрос: Сколько такси в Москве?

❤️ Тинькофф
В этом мне посодействовала бывший продуктовый аналитик OZON. Если вы хотите узнать инсайты и то, чем занимаются аналитики в свободное время, вэлком сюда

🤔 МТС
Прикрепил тестовое на продуктового аналитика в Банк (успешно скипнул, потому что ценность снижается до нуля)

🤨 Интересный вопрос, также на подумать. Сеть ритейлов предоставляет информацию о чеках и проводит акцию по продажам подгузников. У нас есть расположение магазинов (широта и долгота), номер лояльной карты. Также мы имеем внутренний айдишник (в базе МТС), широту и долготу в любой промежуток времени. Как лучше всего сматчить 2 айдишника?

🤔 Я обновил гугл-диск, там можете посмотреть задание. Ссылка тут

Давайте наберём 100+ реакций и 60 репостов на этом посте, а я выложу то, к чему готовлюсь в ближайшее время 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74🐳143👍3
Заскуль питона (Data Science) pinned «Собеседования или история о том, как Максим получил оффер в OZON 💙 Всем привет, в этом посте я расскажу о том, через какие вопросы на собеседованиях я прошел и компании, которые остались в моем сердечке навсегда 😘 Первую часть поста можете посмотреть тут…»
Всем привет! В знаменательный день увольнения с прошлой компании и переход в 💙, хочу запилить отзыв про симулятор МЛ от 🔥.

Спойлер: это не курс, а реальные практические задачи, которые обычно решают MLE. Это и работа с продом, и выгрузка данных из БД, и A/B тесты, и применение различных алгоритмов и т.п. 🙈

В целом, все очень классно! Задачи разделены по уровням сложности от Intern до Senior (от решения базовых задач по типу fit predict до выстраивания взаимосвязанной системы). Очень сильно понравились задачи, связанные с расширением новых инструментов по типу MLFlow, FastAPI, Git, DVC, Docker и др. 😮

Также, я бы отметил и задачи с написанием логики на уровне Intern, например, построения с нуля Decision Tree и реализация Gradient Boosting также с нуля. Необходимая теория расписана достаточно кратко, что более, чем достаточно для прохождения 🗒

За 3 месяца я начал понимать то, как писать красиво код, как работать с ООП и применять ML там, где это действительно нужно 🧠

Важно! Этот курс нацелен на то, чтобы вы понимали бизнес-логику, а не использовали ML абсолютно везде. Про это кстати есть пост на Хабр от создателя курса

Огромное
спасибо за то, что команда 🔥 раскачивается. Я застал запуск проектов, где люди объединяются, чтобы решать реальные проблемы при отсутствии явно поставленных задач (команда придумывает их вместе) 😐

Есть один человечек, который решает задачи с симулятора ML и делает выводы по каждым задачам в своем блоге, советую посмотреть обязательно! Я активно слежу за тем, что он делает и тоже что-то дополнительно черпаю, кстати, ссылочка тут, подписывайтесь
Please open Telegram to view this post
VIEW IN TELEGRAM
25🔥9👍7🐳3😈2🤔1
Продуктовое мышление или как лягушки стали экспертами в аналитике данных: от "ква" до инсайтов (1 часть?) 🤨

В этом посте я бы хотел поговорить о такой важной теме, как продуктовое мышление.

Спойлер: в один пост это все не уместить, поэтому если наберется много реакций, выпущу вторую часть

Зачастую, встречаются люди, которые меряются тем, какими инструментами владеют, что знают по части написания кода, в общем всё подряд, что есть так или иначе в любой документации 💪

По моему мнению, самое главное - это понимать то, что хочет конечный пользователь, для того чтобы это принесло нам деньги. Логично, ведь в этом заинтересован любой бизнес, как ни крути 💳

Предположим, вы формулируете гипотезу о том, что метрика CTR / CR повысится, если провести акцию по привлечению пользователей или допилить сайт. Хорошо, даже придумали то, как можно сплитить трафик для A/B тестирования, как можно это сделать весьма изящно. Однако, отражает ли эта метрика ценность нашего продукта и получаем мы с этого профит? Вопрос открытый 😮

Окей, вроде бы поняли. Давайте разберём кейс, например, сервис доставки еды. Кстати, про это есть отличный подкаст, советую послушать. Понятно, что для каких-то задач можно оперировать метриками, которые так или иначе везде встречаются, и что самое главное, могут отражать ценность для бизнеса 👍

Суть заключается в том, что у каждого продукта есть свои метрики, которые отражают ценность для покупателя и, исследуя которую, можно принести максимальную ценность как клиенту, так и бизнесу при верно сформулированной гипотезе. Для сервисов доставки еды важно, чтобы клиенты получали заказ вовремя, поэтому, они работают над оптимизацией метрики time-to-eat (время от оформления заказа до получения конечным пользователям) 🍪🍪

Если бы было так все просто, можно было во все компании (будь это FinTech, Delivery, EdTech, Offline sales) внедрить шаблон, по которому вы имели возможность оценивать все подряд, однако, на практике это работает только с метриками, которые есть абсолютно в любом продукте (Retention, Churn rate, DAU / WAU / MAU и др.) 😐

Кстати, метрики можно еще и делить на составляющие, про это в свое время говорил Валера Бабушкин, ссылку оставлю здесь. Так например, метрику time-to-eat можно поделить на составляющие:

1. Время отправки информации по заказу в ресторан.
2. Время приготовления заказа.
3. Время, которое нужно курьеру для того, чтобы его забрать.
4. Время, которое нужно курьеру, чтобы вам доставить заказ.

И да, каждую метрику можно оптимизировать еще глубже, например, высылать пуш курьеру раньше, подбирать курьеров таким образом, чтобы их расстояние до ресторана было минимальным (подумайте, почему это может быть плохо), сократить время ожидания информации по заказу и многое другое. Важно, чтобы это приносило в конечном итоге деньги и удовлетворенность пользователей 🙈

Накидайте реакций ПОКА безработной лягушке, а я выложу вторую часть (возможно с детальными фреймворками) или подумаю над тем, как красиво описать то, чем я занимаюсь на работе
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳53🔥168👍21👨‍💻1
Всем доброй ночи, сегодня прошел мой первый день в Ozon ❤️

Как думаете, нормальный ли выйдет формат, если я буду рассказывать то, как развиваюсь внутри компании, как обучаюсь? Пишите свои ответы в комменты, чтобы хотели реально увидеть и ставьте реакции, если вам это может быть интересно 🍪🍪
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳93🔥2417👍8
Кстати, у моего друга из 🔥, вышел гайд по тому, как можно накатить GPT на Streamlit.

Это использовалось при защите проекта в ИТМО. Кому интересно, можете глянуть в этом посте.

Очень классно все расписано, даже если не разбираетесь в этом глубоко, лишним точно не будет 😮
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2🐳1
Пост-знакомство 👉

Ну что ж, давайте поведаю о том, кто пишет для вас посты (да, на фотках я).

Всем привет, меня зовут Максим, мне 20 лет, учусь на 3 курсе в РАНХиГС по направлению «Менеджмент» 😁

Моя история в DS началась не так давно, а если быть точнее, год назад. В один момент я решил копать в сторону IT, потому что маркетинг, трейдинг и продажи (чем я раньше занимался, не приносят такого удовольствия) 😢

Я был тем человеком, который считал, что кейс-чемпионаты - это вышка, а выигрыш в них дает хоть какие-то плюшки. Единственный плюс, как по мне, это нетворкинг. С ребятами, которые участвовали в IT чемпионате, мы общаемся до сих пор 🍪🍪

В свое время наткнулся на видео от Noukash по аналитике данных, кстати чат прикреплю тут, я там часто появляюсь. Очень благодарен коммьюнити за то, что заставляет развиваться, всех люблю ❤️

По классике все началось с Основ статистики от Анатолия Карпова (как по мне, все проходили через этот путь), потом начал пробоваться на различные стажировки, кстати, моей первой попыткой был Ozon Camp по треку аналитики, но что-то пошло не так, я временно забил 😂

Затем увидел хакатон от ВкусВилл, связанным с аналитикой данных и решил попробовать без знаний чего-то специфичного. Тратил я на все это по 10 часов в день, крутил данные и был горд за то, что могу смотреть данные на 30 млн строк, даже какие-то выводы делал. В итоге он длился 7 месяцев, а на команду из 4 человек выплатили 50 000 рублей 🗒

Далее, следующий этап - это трудоустройство, я устроился в компанию Faberlic без релевантного опыта и началось более глубокое погружение в то, чем занимаются компании сейчас. Было очень много откликов и огромный процент отказов 💳

Дополнительно я начал впитывать тонну курсов, смотреть лучшие практики и теперь я работаю в Ozon, the end…

Ставьте реакции, если вам было интересно, пишите комментарии, что бы вы хотели еще узнать, а я пока готовлюсь к следующей рабочей неделе 🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
82🔥27🐳22💘4❤‍🔥2💩2🎄2🤩1🌚1🍓1💋1
ПОДБОРКА КУРСОВ [RU]. 1 Часть 👨‍🔬

Всем привет, многие спрашивали по поводу курсов. Так вот, публикую актуальный список того, что позволит вам в кратчайшие сроки окунуться в этот ваш Data Science [1 часть].

База всех баз:

—————————
📊SQL. По сути хлеб каждого DS-специалиста - это данные. Учимся доставать их таким образом, чтобы это было полезно всем (в том числе и бизнесу). В 💙 мы работаем с Vertica + ClickHouse.

💯 Симулятор SQL от karpov.courses. В мое время не было данного курса, однако, сейчас советую абсолютно всем. Сжатая теория, постоянная практика + блок продуктовой секции, где предстоит решать продуктовые задачи для бизнеса (достать данные, правильно интерпретировать, сделать выводы). Must-have.

Набить руку можно также на других тренажерах, например, тут и тут ( однако, я советую сразу начать решать задачи с собеседований в крупные айти-компании, например, в FAANG на StrataScratch и Leetcode

Далее,
переходим к документации + GPT + Google, если нам нужно что-то дополнительно узнать, не боимся гуглить и спрашивать - это нормально 💼

—————————
🐍 Python. Преобразование данных, работа с типами данных, функциями, циклами, классами

💯 Инди-курс программирования на Python и поколение Python (1 часть, 2 часть). В первом курсе все достаточно емко рассказано по основам, во втором же, более глубокое погружение.
😀 Хэндбук: Основы Python. От базовых вещей до работы с библиотеками. Советую туда не сразу нырять, а остановиться на первых двух.
➡️ Основы Python от karpov.courses. Доступно не все, полная версия к концу июля, однако, советую присмотреться, думаю будет также годно как и SQL

—————————
📊 Статистика и теория вероятностей. А кто говорил, что будет просто? Учимся понимать специфику данных, принимать решения на основе цифр.

💯 Основы статистики (первая и вторая часть). Здесь великий Анатолий Карпов проходит по базам. Проверка гипотез, распределения. Советую просмотреть первую часть и сразу применять все на практике в Python. В этом вам может помочь следующий плейлист от Глеба Михайлова + совмещение этого видео для понимания того, что вообще происходит.

🎲 Теория вероятностей от CSC на Stepik. Советую, чтобы более глубоко понимать, как работать со случайными величинами и с вероятностями в целом. Лично я смотрел тогда, когда необходимо было подготовиться к собеседованиям.

—————————
🧠 Продуктовое мышление. Понимаем более глубоко, а все ли мы делаем правильно, а приносим ли мы профит продукту, нашим пользователям.

💯 Советую присмотреться к лекциям Школы менеджеров Яндекса и совмещать это все с product-map, где собраны лучшие практики по части продукт- и продакт-менеджмента. Также, я недавно выкатывал пост по этому поводу, можете посмотреть тут

—————————
📈BI-Системы. Продвинутая визуализация для отражения текущего состояния бизнеса. Будь то различные метрики или графики, которые отражают ситуацию прямо сейчас.

Практически все сейчас сидят на PowerBI, Redash, SuperSet, DataLens. У Яндекса есть курс по DataLens, у SuperSet есть документация + разбор на YouTube от 🔥, работа в Redash идет в том же симуляторе SQL, который был выше. Все BI-системы похожи друг на друга, поэтому знание специфики работы в одной из них, позволит вам быстро адаптироваться к другой. Однако, функционал, может различаться. В 💙 мы работаем с SuperSet.

У моих друзей также недавно вышли посты с источниками по Data Science, также переходите. По мне, это очень классно, что каждый через призму своего опыта показывает, какие источники оказались наиболее полезными:

🐈 Dimensionссылка на пост
🛞 Азимссылка на пост

🥰 Ставьте реакции, репостите запись, а я выложу вторую часть с подборкой курсов, где будет представлено более глубокое погружение в продуктовую аналитику, аналитику данных и Machine Learning. Также я пилю ноутбук с русской адаптацией курса по Deep Learning (Глубокое обучение), в ближайшем времени также анонсирую
Please open Telegram to view this post
VIEW IN TELEGRAM
98🔥50🤩29👍18🥰13🐳13👏7❤‍🔥1🎉1💩1🍌1
ПОДБОРКА КУРСОВ [RU]. 2 Часть 🧠

Всем привет, нас уже 1600, благодарочка. Выпускаю 2 часть материалов для обучения в сфере Data Science 🤔

Ну что же, когда мы уже обучились базе, можно приступать к более интересным материалам.

Есть несколько путей развития, все зависит от специфики того, чем вы хотите заниматься в будущем. Однако, советую присмотреться ко всем материалам 😱

1. Анализ данных 👍

👦 Анализ данных [ВШЭ] - у курса очень разнообразное наполнение, советую присмотреться. Однако, уроков слишком много, поэтому не советую закапываться слишком глубоко.

🤨 Теория и практика онлайн-экспериментов [ВШЭ]
Теоретическая
база по A/B тестам, советую сразу совмещать с кодом, в первой части я об этом писал.

😮 Computer Science Center. Анализ данных. По сути, все рассказывается весьма интересно, приведены куски кода, что я очень люблю.

2. Machine learning [ВШЭ + ODS + GPT + Networking] 😱

🤖 Основы машинного обучения - сочетание теории и практики. Советую проходить системно и сочетать с домашками, которые прикреплены к курсу. У ВШЭ очень много материалов, как вы поняли ❤️

🔑 Kaggle - место, где люди соревнуются в DS-соревнованиях от крупных компаний и получают за это различные призы. Здесь можно черпать различные фишки по написанию кода, реализации методов и поиска коммьюнити.

🦜 ods.ai - платформа, где представлены различные курсы, соревнования по Data Science. Недавно проходило соревнование по NLP от Alfa-Bank,но не нашлось времени в нем поучаствовать 😡

🎹 Продолжая писать о Machine Learning, также хочется упомянуть курс Юрия Кашницкого. Ближе к теории, однако, курс идет плавно и размеренно.

🗯 Да, да и еще раз да. Личный ментор, который местами галлюцинирует, но это исправляется.

😀 Хэндбук от Яндекс по Machine Learning (не советую приступать сразу, отобьете себе все желание). Математическое или около того обоснование, что происходит. Отсутствует как таковая практика

🕸 Если уж вы совсем преисполнились, тогда вэлком на курс по машинному обучению к Воронцову.

Есть также другие курсы, например, ВШЭ от своей магистратуры выпускала серии по NLP, разработке ML-сервиса и др.
————————————
Параллельно советую читать, смотреть различные бизнес-кейсы компаний, чтобы более глубоко понять специфику работы в компаниях:

> AvitoTech
> Ozon Tech
> Яндекс
————————————
3. Deep Learning ☺️

🔥 Deep Learning School от МФТИ - курс на Stepik, где сочетается теория и практика. Советую залетать тогда, когда уже есть база и когда есть команда, с которой можно будет это все запушить. Тяжелый курс 😡

😢 Глубокое обучение для текстовых данных - базовые концепции в NLP, кода нет

🦌 Хотите research? Идите на arxiv.org и разбирайте различные научные статьи. Кстати, их разбор есть у Игоря Котенкова на YouTube: Transformers, RLHF

Конечно же, это не все источники, есть еще и зарубежные.

Накидайте 🔥 реакций, пишите комментарии, а я выложу handbook [RU] по Deep Learning и расскажу про то, чем успел позаниматься в Ozon и как проходит мое обучение.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7113🐳10👍2💩1
Forwarded from Блог о Data Science 💻 (Danil Kartushov)
🎉 Анонс: Создание клуба Whale Data Science! 🐋🔬

Если вы тоже замечаете магию, стоящую за гигантскими объемами данных, встречайте - клуб Whale Data Science! Наш новый современный коллектив состоит всего из восьми избранных участников, которые, несомненно, внесут свой уникальный вклад в область Data Science.

Наша цель - обмен знаниями, идеями и опытом в мире Data Science и Искусственного Интеллекта.

Следите за нашими обновлениями и постами. Вместе мы сможем раскрыть все возможности, которые дает нам Data Science, и открыть для себя новые горизонты знаний! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳13🔥87💩1