Всем привет, выпускаю пилотный пост своего погружения в Machine Learning и Deep Learning. В целом, пока идёт всё нормально, смотрю про линал. Вопрос к тем, кто знает, зачем нужен линал в ML и DL, если мы все равно засовываем матрицы фич в модель, пытаясь добиться высоких показателей метрик качества? Или это нам нужно для того, чтобы понимать, как все работает под капотом?
Что посмотрел?
Прохожу курс ИИ Старт на Stepik от МФТИ и Deep Learning от МФТИ также, пользуюсь стандартной документацией под библиотеки (sklearn, pandas, numpy)
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳29❤8😍3❤🔥1
https://youtu.be/XyfIE77JQzU
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Мастер-класс "ML Practice"
Всем привет!
В этом видео Данил Картушов из Karpov.Courses расскажет как войти в машинное обучение, почему обработка данных перед обучением модели очень важна и с помощью каких инструментов нарабатывать практический опыт.
Данная лекция проходила в РЭУ…
В этом видео Данил Картушов из Karpov.Courses расскажет как войти в машинное обучение, почему обработка данных перед обучением модели очень важна и с помощью каких инструментов нарабатывать практический опыт.
Данная лекция проходила в РЭУ…
🐳15❤4🌚2⚡1❤🔥1
Мотивационный пост? Нет, практический.
Что для своего обучения в Machine Learning и Deep Learning использую я?
Открытые датасеты, решения других пользователей, можно что-то взять для себя, топовые соревнования
Речь идёт про зарубежные форумы, на которых выкладываются различные решения по запросам пользователей. Скорее всего, на вашу проблему напарывались другие люди.
Promt-инженеры обрадовались. На самом деле, очень классный инструмент, которым нужно пользоваться здесь и сейчас. Пишем запросы и радуемся ответу чудо-машины, берём что-то для себя.
оценка качества модели для машинного обучения на примере…
зачем нужна кросс-валидация и т.д.
Не ЖПТ, просто чаты с реальными людьми. Цель - познакомиться с крутыми специалистами, влиться в сильное комьюнити и вместе развиваться.
Документация, конечно же. Сидим, практикуем английский, если есть вопросы, пишем в чатики и отправляем запрос в AI
А как обучаетесь вы? Пишите в комментариях, ставьте реакции
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳24👍5❤3🔥3🌚1
Пошла вторая неделя моего изучения Machine Learning и Deep Learning.
В планах:
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳28🔥5❤3👍3👨💻3🏆1💋1
На днях я начал задумываться над тем, что ждет всё айти в течение десятилетия. Возможно, все будем жить без еды, кто-то выберет путь наименьшего сопротивления и уйдет в небытие
Ужаснула мысль о том, что с выходом ChatGPT и других AI продуктов в свет, можно по-разному с этим играться. Например, создать платформу, которая будет выступать в роли консалтинга и находить какие-то зависимости в данных и подстраиваться под каждый бизнес. Безусловно, здесь должна идти речь о какой-то конфиденциальности, поскольку никто не хочет в очередной раз видеть слитый ГИТ на 42 гб, как в Яндексе
Интересно вообще понимать, может ли данная платформа, если она будет существовать, разорить бедных аналитиков и тех, кто просто пишет запросики в БД. Что же тогда будет с рынком? Пока неясно
Как на основе каких-то нейросетей, которые обучаются на примерах, например, ищут инсайты в данных и являются promt-инженерами, можно выстроить эффективную работу и реализацию поставленных задач внутри компании? Не могут же уйти просто менеджеры, лиды, ведь именно они занимаются постановкой задач, которые необходимы бизнесу в настоящее время. Возможно, нас будет ждать нечто страшное, способное подстраиваться под любой бизнес и обучаться, спустя какое-то время, возможно, всех не станет
Безусловно, сейчас мы имеем работу с инструментами, которые позволяют в кратчайшие сроки обучаться и искать новую информацию. А что, если вместо этого будет сидеть AI, который будет подстраиваться под данные компаний (если возможно это будет сделать максимально безопасным) и в зависимости от этого, парсинга предстоящих мероприятий, например, будет продумывать решения и закидывать их в ChatGPT или обучаться на них
А что думаете вы по этому поводу? Пишите в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳7😢2❤1👎1
Atomic Heart в реальности?
Всем привет, в этом посте напишу о том, как решил спринтануть ML, чем я пользовался и к чему вообще пришёл. Оговорюсь сразу, мой марафон не закончился🤓
Представьте, у вас есть волшебная таблетка, проглотив которую вы получаете сразу знания по любой интересующей вас области: ML, DA, DE, DL и др.
Согласитесь, это достаточно круто, ведь можно значительно сократить время🏋️
Прикольная штука, но пока у нас нет подобных технологий, жаль. Ну, приходится довольствоваться тем, что имеем🙆
Вдохновившись тем, что ML, нейронные сети - крутое направление, вписался в различные курсы такие, как:
> Deep Learning School от МФТИ
> REU ML School
> ИИ старт от МФТИ
> Основы машинного обучения от ВШЭ
> Основы Data Science и машинное обучение
Используя ChatGPT и параллельно просматривая документацию, курсы, ноутбуки на Kaggle, видео на английском от индусов, я продолжал наращивать свои знания по этому направлению. Я даже составлял RoadMap’у для себя, ну и конечно же, сформировал базу знаний, основываясь на структуре различных курсов🧑🎓
Что посмотрел за 3 недели?
Градиентные спуски, Scalers, Encoders, эмбединги, A/B тесты, алгоритмы, перцептроны, линейные и нелинейные модели, кросс-валидация и сплитование, нейросетки, различные лайфхаки кеглеров, работа с дисбалансом классов, бустинги, сокращение размерности, EDA для моделей, тюн моделей и подбор гиперпараметров, скоры для оценки моделей, кластеризация (из Unsupervised) и многое другое😬
Конечно же, не в совершенстве, я же не ИИ, я лягушонок. Думал и думаю перейти к NLP и CV😶
Вообще, к чему я веду. Если вы думаете, что всемогущи и можете заботать что-то без базы, вэлком в мой мир. Делаю week-off по ML, готовлюсь морально к чемпионату по DS🔒
В сжатые сроки можно все выучить, понимать полезность действий для бизнеса, но смотрите на моральное состояние, а то, возможно, превратитесь в уголь😈
Накидайте реакций на этот пост, делитесь историей своего обучения, пока пойду отдохну на собесах🎁
P.S: Обещаю вернутся с чем-то интересным для вас😘
Всем привет, в этом посте напишу о том, как решил спринтануть ML, чем я пользовался и к чему вообще пришёл. Оговорюсь сразу, мой марафон не закончился
Представьте, у вас есть волшебная таблетка, проглотив которую вы получаете сразу знания по любой интересующей вас области: ML, DA, DE, DL и др.
Согласитесь, это достаточно круто, ведь можно значительно сократить время
Прикольная штука, но пока у нас нет подобных технологий, жаль. Ну, приходится довольствоваться тем, что имеем
Вдохновившись тем, что ML, нейронные сети - крутое направление, вписался в различные курсы такие, как:
> Deep Learning School от МФТИ
> REU ML School
> ИИ старт от МФТИ
> Основы машинного обучения от ВШЭ
> Основы Data Science и машинное обучение
Используя ChatGPT и параллельно просматривая документацию, курсы, ноутбуки на Kaggle, видео на английском от индусов, я продолжал наращивать свои знания по этому направлению. Я даже составлял RoadMap’у для себя, ну и конечно же, сформировал базу знаний, основываясь на структуре различных курсов
Что посмотрел за 3 недели?
Градиентные спуски, Scalers, Encoders, эмбединги, A/B тесты, алгоритмы, перцептроны, линейные и нелинейные модели, кросс-валидация и сплитование, нейросетки, различные лайфхаки кеглеров, работа с дисбалансом классов, бустинги, сокращение размерности, EDA для моделей, тюн моделей и подбор гиперпараметров, скоры для оценки моделей, кластеризация (из Unsupervised) и многое другое
Конечно же, не в совершенстве, я же не ИИ, я лягушонок. Думал и думаю перейти к NLP и CV
Вообще, к чему я веду. Если вы думаете, что всемогущи и можете заботать что-то без базы, вэлком в мой мир. Делаю week-off по ML, готовлюсь морально к чемпионату по DS
В сжатые сроки можно все выучить, понимать полезность действий для бизнеса, но смотрите на моральное состояние, а то, возможно, превратитесь в уголь
Накидайте реакций на этот пост, делитесь историей своего обучения, пока пойду отдохну на собесах
P.S: Обещаю вернутся с чем-то интересным для вас
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳38👍12❤4🔥1
Дорогие девушки, от имени лягушки-аналитика, поздравляю вас с Международным женским днём!
Хочу пожелать вам невероятных успехов в нашей общей страсти - Data Science! Не останавливайтесь на достигнутом, следите за новыми открытиями и не бойтесь экспериментировать🙅
Ведь именно благодаря вашей интуиции и креативности в Data Science можно достичь уникальных результатов. Пусть ваше знание Python, SQL и других аналитических инструментов всегда помогает вам решать сложнейшие аналитические задачи и приводит к блестящим результатам!🤩
Хочу пожелать вам всегда оставаться улыбчивыми и позитивными, ведь ваше настроение и энергия – это то, что заставляет нас вдохновляться и двигаться вперед. Желаю вам не только успешных и точных дешбордов, но и тех, которые будут не только информативными, но и красивыми😘
А ваше умение проводить классные A/B эксперименты – это несомненно круто. Пусть выборка всегда будет репрезентативной, а метрики – прекрасными, такими же, как и вы!😘
Пусть Accuracy (то, как вы точно знаете, как сделать мир лучше),
Precision (ваше остроумие), Recall (ваша забота) и F1-Score (ваш женский инстинкт) были всегда на высоте и стремились к 1😸
Хочу пожелать вам невероятных успехов в нашей общей страсти - Data Science! Не останавливайтесь на достигнутом, следите за новыми открытиями и не бойтесь экспериментировать
Ведь именно благодаря вашей интуиции и креативности в Data Science можно достичь уникальных результатов. Пусть ваше знание Python, SQL и других аналитических инструментов всегда помогает вам решать сложнейшие аналитические задачи и приводит к блестящим результатам!
Хочу пожелать вам всегда оставаться улыбчивыми и позитивными, ведь ваше настроение и энергия – это то, что заставляет нас вдохновляться и двигаться вперед. Желаю вам не только успешных и точных дешбордов, но и тех, которые будут не только информативными, но и красивыми
А ваше умение проводить классные A/B эксперименты – это несомненно круто. Пусть выборка всегда будет репрезентативной, а метрики – прекрасными, такими же, как и вы!
Пусть Accuracy (то, как вы точно знаете, как сделать мир лучше),
Precision (ваше остроумие), Recall (ваша забота) и F1-Score (ваш женский инстинкт) были всегда на высоте и стремились к 1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44👍8🥰4🐳2🤝1🫡1😘1
Почему нужно вписываться во все IT-инициативы?
Привет всем, в этом посте я расскажу о том, почему важно участвовать во всяких кейс-чемпионатах, хакатонах и прочей DS-движухе💼
Я поучаствовал в немалом количестве чемпионатов, где-то даже занимал призовые места, привет💙 . Треки были посвящены маркетингу, продвижению продукта. Вроде бы классно, однако, несмотря на то, что твоя идея могла решить проблему, ты все равно оставался недопонятым жюри, что печально. Есть специализированные кейс-школы, которые обучают по шаблонам как нужно решать задачи, оформлять презы, нет какой-то своей изюминки, а мыслишь ты абстрактными понятиями, которые непонятно откуда рождаются в твоей голове 🤔
Мой путь в аналитике начался с Хакатона, который длился 7 месяцев. Казалось бы, что очень много, но за это время можно было предложить столько гипотез, так покрутить данные, чтобы максимально быстро влиться в то, чем занимаются аналитики🍴
P.S: Была проблема с GPU, пришлось выкручиваться, залутал за хакатон money
Сейчас я работаю аналитиком и хочу подтянуть Machine Learning и Deep Learning для расширения кругозора и возможной переквалификации😎
Для этого я участвую в кейс-чемпионате по Data Science, задача связана с NLP, Machine Learning💃
Команда, кстати, называется «Заскуль Карпова»
Прохожу большое количество курсов, чтобы максимально быстро можно выйти на нормальный уровень в области ML, DL🍷
Это значительно бустит вас, поскольку вы работаете с реальными инструментами в области DS, а не крутите условные игрушечные данные и джойните таблички😮
Но как выжить в таком хаосе? Узнаем чуть позже😨
Накидайте реакций, а я напишу про то, как мы решаем кейс-чемпионат, к чему пришли и какие инсайты нашли в предложенных данных🤔
Привет всем, в этом посте я расскажу о том, почему важно участвовать во всяких кейс-чемпионатах, хакатонах и прочей DS-движухе
Я поучаствовал в немалом количестве чемпионатов, где-то даже занимал призовые места, привет
Мой путь в аналитике начался с Хакатона, который длился 7 месяцев. Казалось бы, что очень много, но за это время можно было предложить столько гипотез, так покрутить данные, чтобы максимально быстро влиться в то, чем занимаются аналитики
P.S: Была проблема с GPU, пришлось выкручиваться, залутал за хакатон money
Сейчас я работаю аналитиком и хочу подтянуть Machine Learning и Deep Learning для расширения кругозора и возможной переквалификации
Для этого я участвую в кейс-чемпионате по Data Science, задача связана с NLP, Machine Learning
Прохожу большое количество курсов, чтобы максимально быстро можно выйти на нормальный уровень в области ML, DL
Это значительно бустит вас, поскольку вы работаете с реальными инструментами в области DS, а не крутите условные игрушечные данные и джойните таблички
Но как выжить в таком хаосе? Узнаем чуть позже
Накидайте реакций, а я напишу про то, как мы решаем кейс-чемпионат, к чему пришли и какие инсайты нашли в предложенных данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳44👍12❤4🔥3
Возвращение короля текстов или как 5 аналитиков решали NLP 🤴
История о том, как я с командой участвовал в соревнованиях по Data Science (NLP). Расскажу о трудностях и о том, к чему пришли.
Относительно недавно я начал ботать DL / ML и решил, а почему бы не поучаствовать в NLP. Раскидали задачи и начали активно работать.
Основная задача - алгоритм ранжирования комментариев под текстом публикации.
Изначально, я думал, что речь идет по RecSys, как с карточками на маркетплейсах, когда вам предлагают похожие товары, но пока не будем про это😢
Первый этап: EDA
Похоже на танцы с бубном и поиск зависимостей в данных. Было выделено несколько фич: количество стоп-слов, слов, предложений, читабельность, тональность и кучу других.
Какие инсайты получили?
Длина текста, определенная тональность и наличие других символов определяют Score на размеченных данных. Дисбаланса классов не было, к over_sampling не приходили🤨
Второй этап: Обработка текста
Стеминг, лемматизация, создание эмбедингов (Word2Vec, TF-IDF, BERT, CountVectorizer), удаление знаков препинания (прикреплю классный слайд с презентации, который нашел на просторах GitHub). «Мешок слов» не использовали, потому что получается матрица, которая сжирает 1 терабайт памяти😢
Третий этап:
Перебор сочетаний с Logistic Regression, KNN, RandomForest, GradientBoosting. Самый лучший NDCG Score = 0,92. При обработке через BERT, возможно, получили бы результат лучше. Имеем, что имеем, ждём результатов🍷
Накидайте реакций, а я накачу пост про Deep Learning, а то немного выбился из режима🗒
История о том, как я с командой участвовал в соревнованиях по Data Science (NLP). Расскажу о трудностях и о том, к чему пришли.
Относительно недавно я начал ботать DL / ML и решил, а почему бы не поучаствовать в NLP. Раскидали задачи и начали активно работать.
Основная задача - алгоритм ранжирования комментариев под текстом публикации.
Изначально, я думал, что речь идет по RecSys, как с карточками на маркетплейсах, когда вам предлагают похожие товары, но пока не будем про это
Первый этап: EDA
Похоже на танцы с бубном и поиск зависимостей в данных. Было выделено несколько фич: количество стоп-слов, слов, предложений, читабельность, тональность и кучу других.
Какие инсайты получили?
Длина текста, определенная тональность и наличие других символов определяют Score на размеченных данных. Дисбаланса классов не было, к over_sampling не приходили
Второй этап: Обработка текста
Стеминг, лемматизация, создание эмбедингов (Word2Vec, TF-IDF, BERT, CountVectorizer), удаление знаков препинания (прикреплю классный слайд с презентации, который нашел на просторах GitHub). «Мешок слов» не использовали, потому что получается матрица, которая сжирает 1 терабайт памяти
Третий этап:
Перебор сочетаний с Logistic Regression, KNN, RandomForest, GradientBoosting. Самый лучший NDCG Score = 0,92. При обработке через BERT, возможно, получили бы результат лучше. Имеем, что имеем, ждём результатов
Накидайте реакций, а я накачу пост про Deep Learning, а то немного выбился из режима
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳35❤2❤🔥2👍2👾2😎1
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳33👍7🔥6❤3
Далее буду участвовать на Kaggle, раскачиваться в RecSys, CV, NLP, возможно поучаствовать в Хакатоне от Вышки
По планам параллельно заботать алгоритмы, сами понимаете для чего
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Блог о Data Science💻
Без сна без отдыха, без жизни: почему у нас больше данных, чем здравого смысла
Приглашаю вас в наш уютный чатик в это воскресенье (9 апреля 20:00 UTC+3) в котором мы поговорим про машинное обучение и ментальное здоровье!
Вход бесплатный!
Приглашаю вас в наш уютный чатик в это воскресенье (9 апреля 20:00 UTC+3) в котором мы поговорим про машинное обучение и ментальное здоровье!
Вход бесплатный!
👍12🐳4❤3🔥2👾2
Всем привет, я вернулся из небытия и готов поделиться с вами над чем я работаю и какой вектор развития у меня сейчас 😬
Прошел уже второй месяц моего участия в Симулятор ML от🔥 . Отдельное спасибо @uberkinder за этот продукт. Спойлер: Прошел чуть больше 50% + взялся за проект 😘
Сейчас у меня висит оффер от💙 на позицию дата-аналитика, но хочу уйти в Machine Learning Engineering 😎
Над чем работаю сейчас?
> RecSys. Недавно была защита проектов для прохождения в магистратуру ИТМО, очень понравилась концепция и реализация @redpf. Более подробно можете ознакомиться в этом посте
> A/B Testing. Планирую заняться разработкой платформы, для этого думаю взять курс по A/B тестам у тех же🔥
> В следующем году буду пробовать в ШАД от😀 или AI Masters от 💙 , поэтому готовлюсь к созданию коммьюнити тех, кому это будет интересно.
Давайте наберём n-ное количество реакций, а я расскажу про то, как сходил на собеседования в различные компании: Avito, Ozon, MTC, Yandex
Прошел уже второй месяц моего участия в Симулятор ML от
Сейчас у меня висит оффер от
Над чем работаю сейчас?
> RecSys. Недавно была защита проектов для прохождения в магистратуру ИТМО, очень понравилась концепция и реализация @redpf. Более подробно можете ознакомиться в этом посте
> A/B Testing. Планирую заняться разработкой платформы, для этого думаю взять курс по A/B тестам у тех же
> В следующем году буду пробовать в ШАД от
Давайте наберём n-ное количество реакций, а я расскажу про то, как сходил на собеседования в различные компании: Avito, Ozon, MTC, Yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Блог о Data Science💻
😬 My First Data Project
Недавно я защитил свой проект в ITMO AI Tallent hub и хочу поделиться с вами отзывом! Вы знаете, что сейчас я пишу диплом и поэтому немного забросил контент.
😯 Что он из себя представляет?
По сути это просто pet project, который курируют…
Недавно я защитил свой проект в ITMO AI Tallent hub и хочу поделиться с вами отзывом! Вы знаете, что сейчас я пишу диплом и поэтому немного забросил контент.
😯 Что он из себя представляет?
По сути это просто pet project, который курируют…
🔥103🐳18❤10🍌2👍1
Собеседования или история о том, как Максим получил оффер в OZON 💙
Всем привет, в этом посте я расскажу о том, через какие вопросы на собеседованиях я прошел и компании, которые остались в моем сердечке навсегда😘
Первую часть поста можете посмотреть тут
Многое поменялось с тех времен, однако, я добился того, чего хотел😬
❤️ AVITO
Все проходят одинаковый набор на аналитиков данных. По сути процесс отбора кандидатов проходит следующим образом: ты собесишься по общим правилам, общему стеку и дальше команды занимаются продажей себя на общей встрече.
🚶♂️ Первый этап: созвон с HR, обсуждение того, над чем работал, первичный скрининг.
😐 Второй этап: созвон с аналитиком, решение задач по статистике и теории вероятностей. p-value, распределения, матожидание. Ранее я делал подборку, где можно углубиться по знаниям данных дисциплин.
😘 Третий этап: созвон с лидом одного из направлений + аналитика. Бизнес-кейсы, гипотезы, SQL + Python.
😮 Вопрос: У нас есть определение геопозиции на сайте. К нам приходит лид и говорит, что нужно улучшить качество клиентского сервиса, что будем делать?
Как плюс: это классный фидбек, который указывает на твои ошибки и над чем стоит поработать!
❤️ OZON
Аналогичный отбор, иду в направление СНГ.
🤨 Вопрос: Сколько такси в Москве?
❤️ Тинькофф
В этом мне посодействовала бывший продуктовый аналитик OZON. Если вы хотите узнать инсайты и то, чем занимаются аналитики в свободное время, вэлком сюда
🤔 МТС
Прикрепил тестовое на продуктового аналитика в Банк (успешно скипнул, потому что ценность снижается до нуля)
🤨 Интересный вопрос, также на подумать. Сеть ритейлов предоставляет информацию о чеках и проводит акцию по продажам подгузников. У нас есть расположение магазинов (широта и долгота), номер лояльной карты. Также мы имеем внутренний айдишник (в базе МТС), широту и долготу в любой промежуток времени. Как лучше всего сматчить 2 айдишника?
🤔 Я обновил гугл-диск, там можете посмотреть задание. Ссылка тут
Давайте наберём 100+ реакций и 60 репостов на этом посте, а я выложу то, к чему готовлюсь в ближайшее время😏
Всем привет, в этом посте я расскажу о том, через какие вопросы на собеседованиях я прошел и компании, которые остались в моем сердечке навсегда
Первую часть поста можете посмотреть тут
Многое поменялось с тех времен, однако, я добился того, чего хотел
Все проходят одинаковый набор на аналитиков данных. По сути процесс отбора кандидатов проходит следующим образом: ты собесишься по общим правилам, общему стеку и дальше команды занимаются продажей себя на общей встрече.
Как плюс: это классный фидбек, который указывает на твои ошибки и над чем стоит поработать!
Аналогичный отбор, иду в направление СНГ.
В этом мне посодействовала бывший продуктовый аналитик OZON. Если вы хотите узнать инсайты и то, чем занимаются аналитики в свободное время, вэлком сюда
Прикрепил тестовое на продуктового аналитика в Банк (успешно скипнул, потому что ценность снижается до нуля)
Давайте наберём 100+ реакций и 60 репостов на этом посте, а я выложу то, к чему готовлюсь в ближайшее время
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Заскуль питона (DA/DS/ML) 🐸
Всем привет, в этом посте поделюсь задачами с различных собесов. Здесь буду кратко резюмировать то, что реально было на собесах, в тестовых заданиях 🧐
📦 OZON
👩💻 Задание на Python (pandas, numpy, знание функций, циклов, визуализаций, распределений)
> обработка…
📦 OZON
👩💻 Задание на Python (pandas, numpy, знание функций, циклов, визуализаций, распределений)
> обработка…
🔥74🐳14❤3👍3
Заскуль питона (Data Science) pinned «Собеседования или история о том, как Максим получил оффер в OZON 💙 Всем привет, в этом посте я расскажу о том, через какие вопросы на собеседованиях я прошел и компании, которые остались в моем сердечке навсегда 😘 Первую часть поста можете посмотреть тут…»
Всем привет! В знаменательный день увольнения с прошлой компании и переход в 💙 , хочу запилить отзыв про симулятор МЛ от 🔥 .
Спойлер: это не курс, а реальные практические задачи, которые обычно решают MLE. Это и работа с продом, и выгрузка данных из БД, и A/B тесты, и применение различных алгоритмов и т.п.🙈
В целом, все очень классно! Задачи разделены по уровням сложности от Intern до Senior (от решения базовых задач по типу fit predict до выстраивания взаимосвязанной системы). Очень сильно понравились задачи, связанные с расширением новых инструментов по типу MLFlow, FastAPI, Git, DVC, Docker и др.😮
Также, я бы отметил и задачи с написанием логики на уровне Intern, например, построения с нуля Decision Tree и реализация Gradient Boosting также с нуля. Необходимая теория расписана достаточно кратко, что более, чем достаточно для прохождения🗒
За 3 месяца я начал понимать то, как писать красиво код, как работать с ООП и применять ML там, где это действительно нужно🧠
Важно! Этоткурс нацелен на то, чтобы вы понимали бизнес-логику, а не использовали ML абсолютно везде. Про это кстати есть пост на Хабр от создателя курса
Огромное спасибо за то, что команда🔥 раскачивается. Я застал запуск проектов, где люди объединяются, чтобы решать реальные проблемы при отсутствии явно поставленных задач (команда придумывает их вместе) 😐
Есть один человечек, который решает задачи с симулятора ML и делает выводы по каждым задачам в своем блоге, советую посмотреть обязательно! Я активно слежу за тем, что он делает и тоже что-то дополнительно черпаю, кстати, ссылочка тут, подписывайтесь
Спойлер: это не курс, а реальные практические задачи, которые обычно решают MLE. Это и работа с продом, и выгрузка данных из БД, и A/B тесты, и применение различных алгоритмов и т.п.
В целом, все очень классно! Задачи разделены по уровням сложности от Intern до Senior (от решения базовых задач по типу fit predict до выстраивания взаимосвязанной системы). Очень сильно понравились задачи, связанные с расширением новых инструментов по типу MLFlow, FastAPI, Git, DVC, Docker и др.
Также, я бы отметил и задачи с написанием логики на уровне Intern, например, построения с нуля Decision Tree и реализация Gradient Boosting также с нуля. Необходимая теория расписана достаточно кратко, что более, чем достаточно для прохождения
За 3 месяца я начал понимать то, как писать красиво код, как работать с ООП и применять ML там, где это действительно нужно
Важно! Этот
Огромное спасибо за то, что команда
Есть один человечек, который решает задачи с симулятора ML и делает выводы по каждым задачам в своем блоге, советую посмотреть обязательно! Я активно слежу за тем, что он делает и тоже что-то дополнительно черпаю, кстати, ссылочка тут, подписывайтесь
Please open Telegram to view this post
VIEW IN TELEGRAM
karpov.courses
Симулятор Data Science
Задачи для практики по анализу данных, машинному обучению и AI. Школа karpov.courses.
❤25🔥9👍7🐳3😈2🤔1
Продуктовое мышление или как лягушки стали экспертами в аналитике данных: от "ква" до инсайтов (1 часть?) 🤨
В этом посте я бы хотел поговорить о такой важной теме, как продуктовое мышление.
Спойлер:в один пост это все не уместить, поэтому если наберется много реакций, выпущу вторую часть
Зачастую, встречаются люди, которые меряются тем, какими инструментами владеют, что знают по части написания кода, в общем всё подряд, что есть так или иначе в любой документации 💪
По моему мнению, самое главное - это понимать то, что хочет конечный пользователь, для того чтобы это принесло нам деньги. Логично, ведь в этом заинтересован любой бизнес, как ни крути💳
Предположим, вы формулируете гипотезу о том, что метрика CTR / CR повысится, если провести акцию по привлечению пользователей или допилить сайт. Хорошо, даже придумали то, как можно сплитить трафик для A/B тестирования, как можно это сделать весьма изящно. Однако, отражает ли эта метрика ценность нашего продукта и получаем мы с этого профит? Вопрос открытый😮
Окей, вроде бы поняли. Давайте разберём кейс, например, сервис доставки еды. Кстати, про это есть отличный подкаст, советую послушать. Понятно, что для каких-то задач можно оперировать метриками, которые так или иначе везде встречаются, и что самое главное, могут отражать ценность для бизнеса👍
Суть заключается в том, что у каждого продукта есть свои метрики, которые отражают ценность для покупателя и, исследуя которую, можно принести максимальную ценность как клиенту, так и бизнесу при верно сформулированной гипотезе. Для сервисов доставки еды важно, чтобы клиенты получали заказ вовремя, поэтому, они работают над оптимизацией метрики time-to-eat (время от оформления заказа до получения конечным пользователям)🍪 🍪
Если бы было так все просто, можно было во все компании (будь это FinTech, Delivery, EdTech, Offline sales) внедрить шаблон, по которому вы имели возможность оценивать все подряд, однако, на практике это работает только с метриками, которые есть абсолютно в любом продукте (Retention, Churn rate, DAU / WAU / MAU и др.)😐
Кстати, метрики можно еще и делить на составляющие, про это в свое время говорил Валера Бабушкин, ссылку оставлю здесь. Так например, метрику time-to-eat можно поделить на составляющие:
1. Время отправки информации по заказу в ресторан.
2. Время приготовления заказа.
3. Время, которое нужно курьеру для того, чтобы его забрать.
4. Время, которое нужно курьеру, чтобы вам доставить заказ.
И да, каждую метрику можно оптимизировать еще глубже, например, высылать пуш курьеру раньше, подбирать курьеров таким образом, чтобы их расстояние до ресторана было минимальным (подумайте, почему это может быть плохо), сократить время ожидания информации по заказу и многое другое. Важно, чтобы это приносило в конечном итоге деньги и удовлетворенность пользователей🙈
Накидайте реакций ПОКА безработной лягушке, а я выложу вторую часть (возможно с детальными фреймворками) или подумаю над тем, как красиво описать то, чем я занимаюсь на работе
В этом посте я бы хотел поговорить о такой важной теме, как продуктовое мышление.
Спойлер:
По моему мнению, самое главное - это понимать то, что хочет конечный пользователь, для того чтобы это принесло нам деньги. Логично, ведь в этом заинтересован любой бизнес, как ни крути
Предположим, вы формулируете гипотезу о том, что метрика CTR / CR повысится, если провести акцию по привлечению пользователей или допилить сайт. Хорошо, даже придумали то, как можно сплитить трафик для A/B тестирования, как можно это сделать весьма изящно. Однако, отражает ли эта метрика ценность нашего продукта и получаем мы с этого профит? Вопрос открытый
Окей, вроде бы поняли. Давайте разберём кейс, например, сервис доставки еды. Кстати, про это есть отличный подкаст, советую послушать. Понятно, что для каких-то задач можно оперировать метриками, которые так или иначе везде встречаются, и что самое главное, могут отражать ценность для бизнеса
Суть заключается в том, что у каждого продукта есть свои метрики, которые отражают ценность для покупателя и, исследуя которую, можно принести максимальную ценность как клиенту, так и бизнесу при верно сформулированной гипотезе. Для сервисов доставки еды важно, чтобы клиенты получали заказ вовремя, поэтому, они работают над оптимизацией метрики time-to-eat (время от оформления заказа до получения конечным пользователям)
Если бы было так все просто, можно было во все компании (будь это FinTech, Delivery, EdTech, Offline sales) внедрить шаблон, по которому вы имели возможность оценивать все подряд, однако, на практике это работает только с метриками, которые есть абсолютно в любом продукте (Retention, Churn rate, DAU / WAU / MAU и др.)
Кстати, метрики можно еще и делить на составляющие, про это в свое время говорил Валера Бабушкин, ссылку оставлю здесь. Так например, метрику time-to-eat можно поделить на составляющие:
1. Время отправки информации по заказу в ресторан.
2. Время приготовления заказа.
3. Время, которое нужно курьеру для того, чтобы его забрать.
4. Время, которое нужно курьеру, чтобы вам доставить заказ.
И да, каждую метрику можно оптимизировать еще глубже, например, высылать пуш курьеру раньше, подбирать курьеров таким образом, чтобы их расстояние до ресторана было минимальным (подумайте, почему это может быть плохо), сократить время ожидания информации по заказу и многое другое. Важно, чтобы это приносило в конечном итоге деньги и удовлетворенность пользователей
Накидайте реакций ПОКА безработной лягушке, а я выложу вторую часть (возможно с детальными фреймворками) или подумаю над тем, как красиво описать то, чем я занимаюсь на работе
Please open Telegram to view this post
VIEW IN TELEGRAM
Бизнес‑секреты
Что такое коэффициент конверсии
Зачем бизнесу следить за этим показателем
🐳53🔥16❤8👍2⚡1👨💻1
Всем доброй ночи, сегодня прошел мой первый день в Ozon ❤️
Как думаете, нормальный ли выйдет формат, если я буду рассказывать то, как развиваюсь внутри компании, как обучаюсь? Пишите свои ответы в комменты, чтобы хотели реально увидеть и ставьте реакции, если вам это может быть интересно🍪 🍪
Как думаете, нормальный ли выйдет формат, если я буду рассказывать то, как развиваюсь внутри компании, как обучаюсь? Пишите свои ответы в комменты, чтобы хотели реально увидеть и ставьте реакции, если вам это может быть интересно
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳93🔥24❤17👍8
Кстати, у моего друга из 🔥 , вышел гайд по тому, как можно накатить GPT на Streamlit.
Это использовалось при защите проекта в ИТМО. Кому интересно, можете глянуть в этом посте.
Очень классно все расписано, даже если не разбираетесь в этом глубоко, лишним точно не будет😮
Это использовалось при защите проекта в ИТМО. Кому интересно, можете глянуть в этом посте.
Очень классно все расписано, даже если не разбираетесь в этом глубоко, лишним точно не будет
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Блог о Data Science 💻
🙃 Streamlit — как создать ChatGPT на коленке [~11 min]
Если мы начнем разговор о мире технологий и программирования, то невозможно обойти такой мощный инструмент, как Streamlit. С его помощью даже самые амбициозные проекты можно запустить в буквальном смысле…
Если мы начнем разговор о мире технологий и программирования, то невозможно обойти такой мощный инструмент, как Streamlit. С его помощью даже самые амбициозные проекты можно запустить в буквальном смысле…
👍4❤2🔥2🐳1
Пост-знакомство 👉
Ну что ж, давайте поведаю о том, кто пишет для вас посты (да, на фотках я).
Всем привет, меня зовут Максим, мне 20 лет, учусь на 3 курсе в РАНХиГС по направлению «Менеджмент»😁
Моя история в DS началась не так давно, а если быть точнее, год назад. В один момент я решил копать в сторону IT, потому что маркетинг, трейдинг и продажи (чем я раньше занимался, не приносят такого удовольствия)😢
Я был тем человеком, который считал, что кейс-чемпионаты - это вышка, а выигрыш в них дает хоть какие-то плюшки. Единственный плюс, как по мне, это нетворкинг. С ребятами, которые участвовали в IT чемпионате, мы общаемся до сих пор🍪 🍪
В свое время наткнулся на видео от Noukash по аналитике данных, кстати чат прикреплю тут, я там часто появляюсь. Очень благодарен коммьюнити за то, что заставляет развиваться, всех люблю❤️
По классике все началось с Основ статистики от Анатолия Карпова (как по мне, все проходили через этот путь), потом начал пробоваться на различные стажировки, кстати, моей первой попыткой был Ozon Camp по треку аналитики, но что-то пошло не так, я временно забил😂
Затем увидел хакатон от ВкусВилл, связанным с аналитикой данных и решил попробовать без знаний чего-то специфичного. Тратил я на все это по 10 часов в день, крутил данные и был горд за то, что могу смотреть данные на 30 млн строк, даже какие-то выводы делал. В итоге он длился 7 месяцев, а на команду из 4 человек выплатили 50 000 рублей🗒
Далее, следующий этап - это трудоустройство, я устроился в компанию Faberlic без релевантного опыта и началось более глубокое погружение в то, чем занимаются компании сейчас. Было очень много откликов и огромный процент отказов💳
Дополнительно я начал впитывать тонну курсов, смотреть лучшие практики и теперь я работаю в Ozon, the end…
Ставьте реакции, если вам было интересно, пишите комментарии, что бы вы хотели еще узнать, а я пока готовлюсь к следующей рабочей неделе🙏
Ну что ж, давайте поведаю о том, кто пишет для вас посты (да, на фотках я).
Всем привет, меня зовут Максим, мне 20 лет, учусь на 3 курсе в РАНХиГС по направлению «Менеджмент»
Моя история в DS началась не так давно, а если быть точнее, год назад. В один момент я решил копать в сторону IT, потому что маркетинг, трейдинг и продажи (чем я раньше занимался, не приносят такого удовольствия)
Я был тем человеком, который считал, что кейс-чемпионаты - это вышка, а выигрыш в них дает хоть какие-то плюшки. Единственный плюс, как по мне, это нетворкинг. С ребятами, которые участвовали в IT чемпионате, мы общаемся до сих пор
В свое время наткнулся на видео от Noukash по аналитике данных, кстати чат прикреплю тут, я там часто появляюсь. Очень благодарен коммьюнити за то, что заставляет развиваться, всех люблю
По классике все началось с Основ статистики от Анатолия Карпова (как по мне, все проходили через этот путь), потом начал пробоваться на различные стажировки, кстати, моей первой попыткой был Ozon Camp по треку аналитики, но что-то пошло не так, я временно забил
Затем увидел хакатон от ВкусВилл, связанным с аналитикой данных и решил попробовать без знаний чего-то специфичного. Тратил я на все это по 10 часов в день, крутил данные и был горд за то, что могу смотреть данные на 30 млн строк, даже какие-то выводы делал. В итоге он длился 7 месяцев, а на команду из 4 человек выплатили 50 000 рублей
Далее, следующий этап - это трудоустройство, я устроился в компанию Faberlic без релевантного опыта и началось более глубокое погружение в то, чем занимаются компании сейчас. Было очень много откликов и огромный процент отказов
Дополнительно я начал впитывать тонну курсов, смотреть лучшие практики и теперь я работаю в Ozon, the end…
Ставьте реакции, если вам было интересно, пишите комментарии, что бы вы хотели еще узнать, а я пока готовлюсь к следующей рабочей неделе
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤82🔥27🐳22💘4❤🔥2💩2🎄2🤩1🌚1🍓1💋1