SQL для аналитика
Зачастую (всегда) данные хранятся в базах данных. По сути, это набор таблиц, которые связаны между собой. Например, таблица customer (информация по пользователям) связана с таблицей payment (информация по оплате) через customer_id. Стоит отметить, что id в таблице customer - первичный ключ (основной) идет к внешнему ключу в таблице payment. Пользователь, сам по себе, в таблице уникальный, однако в таблице payment может встречаться несколько раз.
Спросите, почему мы не можем работать только с таблицей payment? Не факт, что пользователь вообще совершал заказ, однако в таблице customer_id он может быть.
Что часто просят на различных позициях?
1. Уметь писать простые запросы (JOIN, агрегирующие функции, подзапросы)
2. Оконные и другие функции.
Почему нельзя ограничиться одним Python?
1. Не всегда вам будут выгружать информацию в удобном для нас формате (csv, excel, txt).
2. Для выгрузки всей БД не будет хватать ресурсов.
Зачастую (всегда) данные хранятся в базах данных. По сути, это набор таблиц, которые связаны между собой. Например, таблица customer (информация по пользователям) связана с таблицей payment (информация по оплате) через customer_id. Стоит отметить, что id в таблице customer - первичный ключ (основной) идет к внешнему ключу в таблице payment. Пользователь, сам по себе, в таблице уникальный, однако в таблице payment может встречаться несколько раз.
Спросите, почему мы не можем работать только с таблицей payment? Не факт, что пользователь вообще совершал заказ, однако в таблице customer_id он может быть.
Что часто просят на различных позициях?
1. Уметь писать простые запросы (JOIN, агрегирующие функции, подзапросы)
2. Оконные и другие функции.
Почему нельзя ограничиться одним Python?
1. Не всегда вам будут выгружать информацию в удобном для нас формате (csv, excel, txt).
2. Для выгрузки всей БД не будет хватать ресурсов.
🔥7
Как можно работать в этом случае?
1. Писать запрос в SQL для того чтобы вытащить то, что мы исследуем
2. Выгрузить запрос в Python для дальнейшего анализа
Полезные материалы:
✅ Топ-1 тренажер SQL
✅ Учебник + тренажер
✅ Интерактивный тренажер (Stepik)
✅ Задачи с собеседований
✅ Pandas + SQL
1. Писать запрос в SQL для того чтобы вытащить то, что мы исследуем
2. Выгрузить запрос в Python для дальнейшего анализа
Полезные материалы:
✅ Топ-1 тренажер SQL
✅ Учебник + тренажер
✅ Интерактивный тренажер (Stepik)
✅ Задачи с собеседований
✅ Pandas + SQL
www.sql-ex.ru
SQL exercises
SQL remote education. Interactive exercises on SQL statements: SELECT,INSERT,UPDATE,DELETE
❤11
Полезные материалы (практически по всему, что нужно знать)
- Математика, статистика:
Основы математики для цифровых профессий. Яндекс
Математика для поступающих в магистратуру. МФТИ
Линейная алгебра. CSC
Линейная алгебра. МФТИ
Математический анализ (часть 1). CSC
Математический анализ (часть 2). CSC
Основы математического анализа. МФТИ
Теория вероятностей (часть 1). CSC
Теория вероятностей (часть 2). CSC
Теория вероятностей – наука о случайности (часть 1). ТГУ
Теория вероятностей – наука о случайности (часть 2). ТГУ
Основы статистики (часть 1). Институт биоинформатики
Основы статистики (часть 2). Институт биоинформатики
Основы статистики (часть 3). Институт биоинформатики
Математическая статистика. CSC
Прикладной статистический анализ. ВШЭ
Статистика для анализа данных. ВШЭ
Эконометрика. ВШЭ
- Алгоритмы:
Алгоритмы: теория и практика. Методы. CSC
Алгоритмы: теория и практика. Структуры данных. CSC
Подготовка к алгоритмическому собеседованию. Яндекс
- Python:
Программирование на Python. Институт биоинформатики
Python: основы и применение. Институт биоинформатики
"Поколение Python": курс для начинающих. BEEGEEK
"Поколение Python": курс для продвинутых. BEEGEEK
Python-разработка для начинающих. Нетология
Основы Python. Хекслет
Python для извлечения и обработки данных. ВШЭ
Python для искусственного интеллекта. МФТИ
Data Science: будущее для каждого. Нетология
Практикум по математике и Python. Степик
Основы Pandas для начинающих. Степик
Практикум по Pandas. Степик
- R:
Анализ данных в R (часть 1). Институт биоинформатики
Анализ данных в R (часть 2). Институт биоинформатики
Основы программирования на R. Институт биоинформатики
R для лингвистов: программирование и анализ данных. ВШЭ
- Базы данных:
Интерактивный тренажер по SQL. ДВФУ
Оконные функции SQL. Степик
Введение в SQL и работу с базой данных. Нетология
Свободное погружение в СУБД. CSC
Базы данных. СПбГУ
Упражнения по SQL
- ML:
Введение в Data Science и машинное обучение. Институт биоинформатики
Машинное обучение. ОмГТУ
Быстрый старт в искусственный интеллект. МФТИ
Анализ данных на практике. МФТИ
Основы машинного обучения. ВШЭ
- Нейронные сети:
Нейронные сети. Институт биоинформатики
Введение в искусственные нейронные сети. ОмГТУ
Специальные архитектуры нейронных сетей. ОмГТУ
Нейронные сети и компьютерное зрение Samsung
Нейронные сети и обработка текста. Samsung
Анализ текстовых данных. ВШЭ
Компьютерное зрение. ВШЭ
- Другое:
Hadoop. Система для обработки больших объемов данных. VK
Введение в Linux. Институт биоинформатики
Введение в Git. Хекслет
Основы Git. Степик
Основы командной строки. Хекслет
Инженер облачных сервисов. Яндекс
#полезныематериалы
- Математика, статистика:
Основы математики для цифровых профессий. Яндекс
Математика для поступающих в магистратуру. МФТИ
Линейная алгебра. CSC
Линейная алгебра. МФТИ
Математический анализ (часть 1). CSC
Математический анализ (часть 2). CSC
Основы математического анализа. МФТИ
Теория вероятностей (часть 1). CSC
Теория вероятностей (часть 2). CSC
Теория вероятностей – наука о случайности (часть 1). ТГУ
Теория вероятностей – наука о случайности (часть 2). ТГУ
Основы статистики (часть 1). Институт биоинформатики
Основы статистики (часть 2). Институт биоинформатики
Основы статистики (часть 3). Институт биоинформатики
Математическая статистика. CSC
Прикладной статистический анализ. ВШЭ
Статистика для анализа данных. ВШЭ
Эконометрика. ВШЭ
- Алгоритмы:
Алгоритмы: теория и практика. Методы. CSC
Алгоритмы: теория и практика. Структуры данных. CSC
Подготовка к алгоритмическому собеседованию. Яндекс
- Python:
Программирование на Python. Институт биоинформатики
Python: основы и применение. Институт биоинформатики
"Поколение Python": курс для начинающих. BEEGEEK
"Поколение Python": курс для продвинутых. BEEGEEK
Python-разработка для начинающих. Нетология
Основы Python. Хекслет
Python для извлечения и обработки данных. ВШЭ
Python для искусственного интеллекта. МФТИ
Data Science: будущее для каждого. Нетология
Практикум по математике и Python. Степик
Основы Pandas для начинающих. Степик
Практикум по Pandas. Степик
- R:
Анализ данных в R (часть 1). Институт биоинформатики
Анализ данных в R (часть 2). Институт биоинформатики
Основы программирования на R. Институт биоинформатики
R для лингвистов: программирование и анализ данных. ВШЭ
- Базы данных:
Интерактивный тренажер по SQL. ДВФУ
Оконные функции SQL. Степик
Введение в SQL и работу с базой данных. Нетология
Свободное погружение в СУБД. CSC
Базы данных. СПбГУ
Упражнения по SQL
- ML:
Введение в Data Science и машинное обучение. Институт биоинформатики
Машинное обучение. ОмГТУ
Быстрый старт в искусственный интеллект. МФТИ
Анализ данных на практике. МФТИ
Основы машинного обучения. ВШЭ
- Нейронные сети:
Нейронные сети. Институт биоинформатики
Введение в искусственные нейронные сети. ОмГТУ
Специальные архитектуры нейронных сетей. ОмГТУ
Нейронные сети и компьютерное зрение Samsung
Нейронные сети и обработка текста. Samsung
Анализ текстовых данных. ВШЭ
Компьютерное зрение. ВШЭ
- Другое:
Hadoop. Система для обработки больших объемов данных. VK
Введение в Linux. Институт биоинформатики
Введение в Git. Хекслет
Основы Git. Степик
Основы командной строки. Хекслет
Инженер облачных сервисов. Яндекс
#полезныематериалы
🔥13❤4👏3🤯2
Собеседования
Всем привет, наконец-то админ очухался и готов вам рассказать о собеседованиях в различные компании на позицию аналитика
🟢
🔵
🟡⚫️
🔵🟣
🔴⚪️
🔵⚪️
Какой из этого можно сделать вывод?
1. Ходите на собеседования, чтобы понимать, что от вас хотят компании + понимать пробелы в знаниях.
2. Конечно же изучайте SQL, решайте боевые, прикладные задачи, мб что-то выложите на GitHub.
3. Математика - наш друг, ботайте матешу.
4. Не расстраивайтесь, если что-то идет не так, потому что вы все УМНИЧКИ!
Если есть какие-то предложения, пишите админу в личку, он вроде не кусается (это не точно).
Стоит отметить, что созвонов с HR было масса и иногда складывлось такое ощущение, что работаешь по скрипту)
Всем привет, наконец-то админ очухался и готов вам рассказать о собеседованиях в различные компании на позицию аналитика
🟢
СберБанк
Изначально на позицию требовалось автоматизировать документооборот, на собесе спрашивали про знание SQL, Python. Тестовое дали на Excel... В общем, чума🔵
Самолет
Знание SQL, написание простых запросов be like. 🟡⚫️
Тинькофф
Есть догадки, что дали? Правильно, математику (комбинаторика, теория вероятностей). Было несколько этапов. От простых задач, которые нужно было скинуть HR с дальнейшим обсуждением хода решений. После, был созвон с руководителем, где опять же дали математику, это база для Тиньки.🔵🟣
OZON
Здесь уже есть какая-то +- норм работа, дали SQL и Python. Заметили, что SQL дают везде? Правильно, его нужно ботать.🔴⚪️
МТС
Позиция на продуктового аналитика, больше упор на расчет различных метрик. Например, задача: посчитать Retention 5-го дня, based. Прикол, что на собеседовании было 5 человек, 3 из которых аналитики. Вопрос, чем занимаются аналитики? Правильно, смотрят на то, как ты решаешь в формате live-кодинга задачки)🔵⚪️
ВКонтакте
Изначально мне позвонил HR в унике, думал, что созвон на минут 10-15, как обычно, в итоге отвечал на вопросы по статистике и эконометрике целый час (преподу привет, кстати). Ничего сложного, если вы смотрели курс Карпова, я бы даже сказал изи. После - созвон с аналитиком и с ноги сразу залетает задача с... ML (Machine Learning). Как опыт, вполне неплохо.🟢 АО национальная система платежных картЗадачки на понимание SQL (оконки, join, ничего сложного, всё решаемо), Python и Pandas. А где матеша? А вот не понимаю...
Какой из этого можно сделать вывод?
1. Ходите на собеседования, чтобы понимать, что от вас хотят компании + понимать пробелы в знаниях.
2. Конечно же изучайте SQL, решайте боевые, прикладные задачи, мб что-то выложите на GitHub.
3. Математика - наш друг, ботайте матешу.
4. Не расстраивайтесь, если что-то идет не так, потому что вы все УМНИЧКИ!
Если есть какие-то предложения, пишите админу в личку, он вроде не кусается (это не точно).
Стоит отметить, что созвонов с HR было масса и иногда складывлось такое ощущение, что работаешь по скрипту)
❤22👏3❤🔥2
Всем салют! Классные выходные, не правда ли?
Делюсь с вами полезными материалами, которые помогут вам в кратчайшие сроки стать Junior дата-аналитиком без регистрации и смс. В общем, походя по различным собеседованиям от лидеров ру рынка и не только понял, что может помочь бедным хомячкам дать отпор потным задротам, которые составляют задачки в ШАД (без обид).
SQL - ниже прикреплю краткую методичку с основными функциями + дам инсайд тестового на jun-middle аналитика от OZON, может что-то порешаете, отпишите как прошло). Тем более, куча тренажеров есть, так что, дерзайте, все у вас получится!
[EN] LeetCode
[RU] ITresume
[RU] Симулятор ITResume
[RU] Потный SQL
И куча других тренажеров, главное практика! Если знаете, что такое оконные функции и как можно оптимизировать SQL запрос, вас оторвут с руками и ногами, но не в МТС)
Дэшборды - многие компании уходят от PowerBI, что грустно, поэтому сразу настраиваемся на SuperSet и DataLens, мб GreenPlum (это любит компания с зеленой галочкой, если вы понимаете о чем я)
Я.Практикум (DataLens)
SuperSet (Карпов)
Если вам интересно, могу сделать отдельный пост по дешбордам (наверное)
Python - мое удивление, что требуют не так много, потому что зачастую придется работать с SQL. Какой-нибудь скрипт быстро накатить или что-то подобное, классика жанра. Тут все зависит от компании. В ВК дали задачи по библиотекам для анализа данных без использования доп. скриптов, в OZON то же самое + еще что-то по базе. Это и курсы Хирьянова от МФТИ и Карпова, их очень много, если нет базы, смотрите любой, лишним точно не будет.
Excel - спрашивается,нахуя зачем? Ну удобный инструмент, че бубнить. Можно глянуть какие-то визуализации, потыкаться и всё. Если работаем в крупной компании Excel релевантен на стадии выгрузки каких-то отчетов, не более. На Youtube очень много разборов всяких, Welcome.
Продуктовое мышление - идешь такой себе, думаешь что будешь работать с циферками для получения циферок (себе на покушать), но нет! Понимать специфику продукта и метрики очень важно, прикрепляю ниже ссылку для продактов. + курс от Тиньки, который публиковался для студентов МГУ, ВШЭ + слушателей, да-да, я.
Статистика - все просто, STEPIK, Карпов, думаю тут понятно. Понимание вообще того, как работают различные распределения, как сгенерить искусственные данные и посмотреть на какие-то зависимости, прикреплю ниже тестовое от Ozon, посмотрите покрутите, мне понравилось.
Теория вероятностей - всё сложнее, поскольку сложно не углубиться в науку и хочется как-то использовать всё здесь и сейчас. Ранее прикреплял плейлист от препода в Яндекс.Практикуме, но пусть он тут тоже будет. Если хотите базу, то это тот же STEPIK или курсы какого-нибудь Райгородского (кто знает, тот поймет, сразу PRESS F).
В целом, можно упороться и заботать полностью матешу, но это тот минимум, который вам должен гарантировать трудоустройство при должной сноровке и практике. Убедительная просьба, если что-то не получается, не бить!
Меня поразило, что Тинькофф запустил курс по анализу данных для школьников, где всё +- разжевано, а я, как школьник сидел и прогал на Кумире или Pascal, эх, молодость.
Делитесь со всеми этим постом, ставьте лайки, подписывайтесь на канал))))
Всё у вас получится, главное не сбавляйте темп (звучало как из какого-то инфобиза)
Делюсь с вами полезными материалами, которые помогут вам в кратчайшие сроки стать Junior дата-аналитиком без регистрации и смс. В общем, походя по различным собеседованиям от лидеров ру рынка и не только понял, что может помочь бедным хомячкам дать отпор потным задротам, которые составляют задачки в ШАД (без обид).
SQL - ниже прикреплю краткую методичку с основными функциями + дам инсайд тестового на jun-middle аналитика от OZON, может что-то порешаете, отпишите как прошло). Тем более, куча тренажеров есть, так что, дерзайте, все у вас получится!
[EN] LeetCode
[RU] ITresume
[RU] Симулятор ITResume
[RU] Потный SQL
И куча других тренажеров, главное практика! Если знаете, что такое оконные функции и как можно оптимизировать SQL запрос, вас оторвут с руками и ногами, но не в МТС)
Дэшборды - многие компании уходят от PowerBI, что грустно, поэтому сразу настраиваемся на SuperSet и DataLens, мб GreenPlum (это любит компания с зеленой галочкой, если вы понимаете о чем я)
Я.Практикум (DataLens)
SuperSet (Карпов)
Если вам интересно, могу сделать отдельный пост по дешбордам (наверное)
Python - мое удивление, что требуют не так много, потому что зачастую придется работать с SQL. Какой-нибудь скрипт быстро накатить или что-то подобное, классика жанра. Тут все зависит от компании. В ВК дали задачи по библиотекам для анализа данных без использования доп. скриптов, в OZON то же самое + еще что-то по базе. Это и курсы Хирьянова от МФТИ и Карпова, их очень много, если нет базы, смотрите любой, лишним точно не будет.
Excel - спрашивается,
Продуктовое мышление - идешь такой себе, думаешь что будешь работать с циферками для получения циферок (себе на покушать), но нет! Понимать специфику продукта и метрики очень важно, прикрепляю ниже ссылку для продактов. + курс от Тиньки, который публиковался для студентов МГУ, ВШЭ + слушателей, да-да, я.
Статистика - все просто, STEPIK, Карпов, думаю тут понятно. Понимание вообще того, как работают различные распределения, как сгенерить искусственные данные и посмотреть на какие-то зависимости, прикреплю ниже тестовое от Ozon, посмотрите покрутите, мне понравилось.
Теория вероятностей - всё сложнее, поскольку сложно не углубиться в науку и хочется как-то использовать всё здесь и сейчас. Ранее прикреплял плейлист от препода в Яндекс.Практикуме, но пусть он тут тоже будет. Если хотите базу, то это тот же STEPIK или курсы какого-нибудь Райгородского (кто знает, тот поймет, сразу PRESS F).
В целом, можно упороться и заботать полностью матешу, но это тот минимум, который вам должен гарантировать трудоустройство при должной сноровке и практике. Убедительная просьба, если что-то не получается, не бить!
Меня поразило, что Тинькофф запустил курс по анализу данных для школьников, где всё +- разжевано, а я, как школьник сидел и прогал на Кумире или Pascal, эх, молодость.
Делитесь со всеми этим постом, ставьте лайки, подписывайтесь на канал))))
Всё у вас получится, главное не сбавляйте темп (звучало как из какого-то инфобиза)
IT Resume
Задачи по аналитике данных, алгоритмам и программированию на Python и SQL | IT Resume
Симулятор по решению задач для аналитика данных - Python, SQL, алгоритмы и др. Прокачивайте навыки с помощью тренажера платформы IT Resume и готовьтесь к техническим собеседованиям.
👍24🔥1
Тестовое_задание_для_аналитиков_Операционный_Аналитик.pdf
936 KB
То самое тестовое от OZON, вкуснятина)
🔥25👍3
Полезные материалы по SQL, как и обещал, выгрузил на Google-диск
Накидайте актива за старание, пожалуйста ☺️
Накидайте актива за старание, пожалуйста ☺️
❤34🔥7👍3
400! Как я рад, всем спасибо, что остаётесь с нами. Дальше будет контент ещё лучше 🥹
Всех обнял, поднял, заплакал ❤️
Всех обнял, поднял, заплакал ❤️
🥰21😈6🤡3🎉2
Всем привет! Ребятки, которые проходят курс от РАНХиГС по анализу данных (Python & SQL), дайте фидбек, как вам?
Что стоит разобрать в ближайшем будущем, пишите свои идеи. Если админ будет готов, он обязательно сделает 🥹