Заскуль питона (Data Science)
6.2K subscribers
110 photos
15 videos
4 files
142 links
Канал про Python, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Чат: https://t.iss.one/my_it_frogs
Download Telegram
Всем салют! Классные выходные, не правда ли?

Делюсь
с вами полезными материалами, которые помогут вам в кратчайшие сроки стать Junior дата-аналитиком без регистрации и смс. В общем, походя по различным собеседованиям от лидеров ру рынка и не только понял, что может помочь бедным хомячкам дать отпор потным задротам, которые составляют задачки в ШАД (без обид).

SQL - ниже прикреплю краткую методичку с основными функциями + дам инсайд тестового на jun-middle аналитика от OZON, может что-то порешаете, отпишите как прошло). Тем более, куча тренажеров есть, так что, дерзайте, все у вас получится!
[EN] LeetCode
[RU] ITresume
[RU] Симулятор ITResume
[RU] Потный SQL
И куча других тренажеров, главное практика! Если знаете, что такое оконные функции и как можно оптимизировать SQL запрос, вас оторвут с руками и ногами, но не в МТС)

Дэшборды - многие компании уходят от PowerBI, что грустно, поэтому сразу настраиваемся на SuperSet и DataLens, мб GreenPlum (это любит компания с зеленой галочкой, если вы понимаете о чем я)
Я.Практикум (DataLens)
SuperSet (Карпов)
Если вам интересно, могу сделать отдельный пост по дешбордам (наверное)

Python - мое удивление, что требуют не так много, потому что зачастую придется работать с SQL. Какой-нибудь скрипт быстро накатить или что-то подобное, классика жанра. Тут все зависит от компании. В ВК дали задачи по библиотекам для анализа данных без использования доп. скриптов, в OZON то же самое + еще что-то по базе. Это и курсы Хирьянова от МФТИ и Карпова, их очень много, если нет базы, смотрите любой, лишним точно не будет.

Excel - спрашивается, нахуя зачем? Ну удобный инструмент, че бубнить. Можно глянуть какие-то визуализации, потыкаться и всё. Если работаем в крупной компании Excel релевантен на стадии выгрузки каких-то отчетов, не более. На Youtube очень много разборов всяких, Welcome.

Продуктовое мышление - идешь такой себе, думаешь что будешь работать с циферками для получения циферок (себе на покушать), но нет! Понимать специфику продукта и метрики очень важно, прикрепляю ниже ссылку для продактов. + курс от Тиньки, который публиковался для студентов МГУ, ВШЭ + слушателей, да-да, я.

Статистика - все просто, STEPIK, Карпов, думаю тут понятно. Понимание вообще того, как работают различные распределения, как сгенерить искусственные данные и посмотреть на какие-то зависимости, прикреплю ниже тестовое от Ozon, посмотрите покрутите, мне понравилось.

Теория вероятностей - всё сложнее, поскольку сложно не углубиться в науку и хочется как-то использовать всё здесь и сейчас. Ранее прикреплял плейлист от препода в Яндекс.Практикуме, но пусть он тут тоже будет. Если хотите базу, то это тот же STEPIK или курсы какого-нибудь Райгородского (кто знает, тот поймет, сразу PRESS F).

В целом, можно упороться и заботать полностью матешу, но это тот минимум, который вам должен гарантировать трудоустройство при должной сноровке и практике. Убедительная просьба, если что-то не получается, не бить!

Меня поразило, что Тинькофф запустил курс по анализу данных для школьников, где всё +- разжевано, а я, как школьник сидел и прогал на Кумире или Pascal, эх, молодость.

Делитесь со всеми этим постом, ставьте лайки, подписывайтесь на канал))))

Всё у вас получится, главное не сбавляйте темп (звучало как из какого-то инфобиза)
👍24🔥1
Полезные материалы по SQL, как и обещал, выгрузил на Google-диск

Накидайте актива за старание, пожалуйста ☺️
34🔥7👍3
400! Как я рад, всем спасибо, что остаётесь с нами. Дальше будет контент ещё лучше 🥹

Всех обнял, поднял, заплакал ❤️
🥰21😈6🤡3🎉2
TQDM не хватает, но идея неплохая, я так взломал СДО в ранепе.

#мемы
🤡7❤‍🔥1
Всем привет! Ребятки, которые проходят курс от РАНХиГС по анализу данных (Python & SQL), дайте фидбек, как вам?
Что стоит разобрать в ближайшем будущем, пишите свои идеи. Если админ будет готов, он обязательно сделает 🥹
К чему я вообще замутил данный опрос, пора бы нам поближе познакомиться с каждым. Если большая часть в мск, можем встретиться на оффлайн-встрече, если нет, то в зуме 🥹

Пишите в комментариях, кто за, плюсики там в комментах, реакции и тд.

Можете написать админу в личку, если есть необходимость в этом @m459n9 😇
❤‍🔥8🔥5🕊1💋1
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшие технические шоколадки 🥹

#мемы
❤‍🔥54🥰1🤡1
Вечер воскресенья и я опять пришел к вам с очередным подгоном полезных материалов, которые смотрю сейчас, всем советую!

Яндекс. Основы Python. Достаточно много задач + классная теория, достаточно все понятно. Курс для начинающих, но потренить задачи самое оно.
Тестовые задания топ-компаний в США и не только. О ресурсе узнал относительно недавно, но будет полезен тем, кто хочет заботать SQL + Python. Все классно!
Для тех, кто хочет фундаментально подтянуть матешу, прогу + ML, советую ресурс от ФКН ВШЭ. Полезно тем, кто думает переводиться (вопрос, кто же?).
Кто хочет уйти больше в ML. Для вас есть хэндбук от яндекса, прикреплял выше. Здесь нужна какая-то база. Сам ресурс.
Следить за обновлениями по хэндбукам можно здесь.
С тех пор, как на курсере убрали курс от МФТИ и Яндекса, о чем я сожалею (хотя ссылка на гитхаб имеется), я был в поиске нормальных материалов для изучения. От тиньки посоветовали данный курс. Больше инфы для школьников и не только от тиньки туть.

Ниже прикреплю pdf-файл с классной книгой по стате для Data Science.

Не сбавляйте темп, ну и конечно же, накидайте реакций за старания, админ старается, честно 😇
🔥16🐳41🤡1💯1
Практическая_статистика_для_специалистов_Data_Science_2022_Питер.pdf
12.4 MB
Та самая книга по стате!

Накидайте актива блин 🙃
🔥33🍓6🤡3👀2🌭1🍌1
Заскуль питона (Data Science) pinned «К чему я вообще замутил данный опрос, пора бы нам поближе познакомиться с каждым. Если большая часть в мск, можем встретиться на оффлайн-встрече, если нет, то в зуме 🥹 Пишите в комментариях, кто за, плюсики там в комментах, реакции и тд. Можете написать…»
Всем доброе утро! Закину милоты вам в ленту. Да, на фото два админа, угадайте кто выкладывает этот пост. Если соберёмся на встрече, знайте кого искать 🥹

P.S: Пошёл работать над новым контентом по классике, думаю разобрать методы, которые используются в ecom-компаниях. Мы же аналитики, должны все знать, конечно же + скину полезные материалы, которые можно почитать на досуге, будет полезно 😇
❤‍🔥184😍3🤡2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Доброе утро, Страна!😶‍🌫️🫥🦄
😁3🤡2🤯1🕊1
Ну что ж, закончилась рабочая неделя, а это значит, что админ готов выйти на связь.

Вопрос остаётся открытым: чем занимаются аналитики? Ничем. Приносят деньги бизнесу? Возможно, а может и нет, все мы знаем о minimum detectable effect, как в плюс так и в минус.

Что успел поделать?

-
Поработать с API, JSON вплотную, попрогать на Python, собрать стату, отследить динамику показателей. 🐍

- Ad-hoc запросы. Классика жанра.

Реальный кейс: вывести номер телефона из DataFrame на 2+ млн строк с использованием маски. Пример : + 7 (920) 143-12-12. Загвоздка есть, страны разные. Решение? Есть в гугле, адаптируйте). + 445, +44 F

- Вытаскивать данные из OLAP-кубов в Excel, создавать сводники. Стоп-стоп, Excel, чел, уйди, умойся 😑

- Писать запросы на Oracle (SQL, think about, real talk). Тут классика, берёте стандартные функции + чуть побольше. Спойлер: в БД > 100 таблиц 😑

- В ожидании: A/B тестов, презентации проекта, возможно, ML (ждём-с).

Полезные ссылки остаются такими же, ничего не поменялось.

Успехов! 🥹
🔥8❤‍🔥2😍1
Не отходя от кассы, важное объявление. Со следующей недели мы будем публиковать посты про Product-Management.

Да, подписчики, мы развиваемся по всем фронтам, дальше - больше 🙃

На выходных будет ещё пост про полезные материалы (по аналитике, привычной обычным подписчикам паблика Заскуль Питона ГЕНИЯМ).

Накидайте реакций, чтобы было больше мотивашки стараться и выкладывать максимально качественный контент 🐳

Ставим лайки, подписываемся на канал, жмём на колокольчик, делимся с друзьями/коллегами/партнерами ☺️

На сегодня всё! Всем хороших выходных, дед ушёл спать 😘
🔥19🤡3🐳3👨‍💻2👍1
Друзья, пройдите опрос, пожалуйста, кому несложно, заранее спасибо.

https://docs.google.com/forms/d/e/1FAIpQLScPxsZgbddfRGBxgAoKRago81F0FwDC2Bt1GW8oaOVZ8XdCwQ/viewform
👌5
Админы ботают every day, every night
6🔥4🤡1🍓1
Коллеги, всем доброй ночи, рад всех видеть. Ну что ж, пришло время для продуктовых метрик, которые используются повсеместно для оценки перспективности того или иного продукта компании. Конечно же, самый первый - это ...

Retention — коэффициент удержания пользователей, который рассчитывается как отношение количества уникальных пользователей в определенном периоде на количество уникальных пользователей в начале пользования продукта. Так можно понять, где отваливаются пользователи. Пример можете глянуть туть, разбор в SQL

Churn Rate — коэффициент оттока (единица - Retention)

ее величество КОНВЕРСИЯ. Отношение количества успешных действий в общее количество пользователей (берется базово). Конверсию можно считать от чего и во что как угодно, ваше право. Можно прикрутить к A/B тестам, когда мы тестируем то, насколько стат значимо или нет было наше внедрение.

LTV - Жизненная ценность клиента (то, сколько ВСЕГО деняк нам принес милый юзер). Но вот проблема, как считать LTV клиента, если у нас нет данных за предыдущий период, пишите предположения в комментариях.

DAU / MAU (не Владимир) / WAU - дневная / месячная / недельная аудитория. Всё понятненько, да? Разбивка по датам и подсчет по периодам юзеров.

ARPU - Средний доход с юзера. Так мы можем оценить затраты на привлечение каждого пользователя. ARPPU - Средний доход с платящего пользователя. Достаточно похожие понятия, но среднее берется только с платящих, возможно, определяем какую акцию можем заложить на юзера.

Если вы знаете эти заклинания, то любая HRюшка будет вас звать на собеседование и смотреть на вас, как на второго Илона Макса.
16