Аналитика данных / Data Study
8.85K subscribers
476 photos
42 videos
24 files
375 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
Материалы с вебинара "От отклика до оффера"

В
прошлую среду Соня, it-рекрутер, провела вебинар для вас, где рассказала огромное количество полезной информации. Все можно посмотреть в записи трансляции и в презентации.

▶️ Запись вебинара

🖇 Презентация вебинара

🖇 Шаблон резюме, который можете использовать как корректную структуру и фразы-подсказки

Наверняка кто-то пропустил публикацию в группе вебинаров, дублирую сюда 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥52
Приглашаем в канал AI Inside

Канал для тех, кто смотрит на искусственный интеллект не как на хайп, а как на рабочий инструмент. Здесь нет абстрактных теорий — только прикладные решения.

Что вас ждет:
✔️ Технологии: расскажем, как ИИ решает реальные бизнес-задачи — от автоматизации до аналитики.
✔️ Кейсы: покажем успешные примеры внедрения и использования ИИ-инструментов.
✔️ Экспертиза: объясним сложные технологии простым языком с фокусом на практическую пользу.

Наша цель — дать конкретные идеи и инсайты, которые можно применить уже сегодня.

Присоединяйтесь к сообществу практиков!
👍41🔥1
25 вопросов с собеседований по SQL

Базовый уровень:
1. Что делает команда SELECT и как выбрать все колонки из таблицы?
2. В чем разница между WHERE и HAVING?
3. Что делает GROUP BY и ORDER BY и в каком порядке они выполняются?
4. Как объединить две таблицы? Чем отличаются INNER JOIN, LEFT JOIN, RIGHT JOIN и FULL JOIN?
5. Как выбрать уникальные значения из колонки?

Средний уровень:
6. Что делает агрегатная функция и какие бывают (COUNT, SUM, AVG, MAX, MIN)?
7. Как с помощью подзапроса выбрать сотрудников с зарплатой выше средней?
8. Что такое CASE WHEN и как его использовать для логических условий в запросах?
9. Чем отличаются UNION и UNION ALL? Когда что использовать?
10. Как найти дубликаты записей в таблице и удалить их?

Высокий уровень:
11. Что такое оконная функция и чем она отличается от GROUP BY?
12. Как найти вторую по величине зарплату в таблице без подзапроса?
13. Что делает COALESCE() и зачем он нужен?
14. Как работают индексы и как они влияют на производительность?
15. Что делает EXPLAIN (или EXPLAIN ANALYZE)? Как понять, где узкое место запроса?

Продвинутый уровень:
16. Как реализовать “рекурсивный запрос” с помощью WITH RECURSIVE?
17. Какие есть виды блокировок в базе данных и как это влияет на выполнение запросов?
18. Как соединить таблицу с самой собой (self join) и для чего это может быть нужно?
19. Объясни разницу между INNER JOIN, CROSS JOIN и LATERAL JOIN.
20. Что делает RANK(), DENSE_RANK() и ROW_NUMBER() и в чем между ними разница?
21. Как бы ты посчитал “скользящее среднее” (moving average) по продажам за последние 7 дней?
22. Как посчитать нарастающий итог по сумме продаж?
23. Как найти “дыры” в последовательности (например, пропущенные ID)?
24. Что такое нормализация и денормализация данных, и когда что применять?
25. Как оптимизировать медленный запрос? Назови конкретные приёмы.
👍24🔥126👀3
Подборка книг для новичков с простой лексикой по анализу данных и Data Science

🔹Наука о данных с нуля / Джоэл Грас
"Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине"

🔹Работа с данными в любой сфере / Кирилл Еременко
"Эта книга — практическое руководство и увлекательное путешествие в науку о данных, независимо от того, хотите ли вы использовать анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или уже работаете в этой области."

🔹Статистика и котики / Владимир Савельев
"Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое. И все это – на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций."
1👍15🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
VK RecSys Challenge: проверьте свой алгоритм в деле!

В самом разгаре ежегодное соревнование по разработке рекомендательных систем от VK — RecSys Challenge 2025. Участникам предстоит решить одну из самых сложных проблем в мире рекомендаций: задачу холодного старта.

Суть соревнования — построить модель, которая предскажет, кому из пользователей понравится новый клип, даже если его ещё никто не видел.

Что ждёт участников:
• Реальные данные — датасет VK-LSVD с 40 млрд взаимодействий и 20 млн коротких видео
• Можно участвовать соло или в команде до 4 человек
• Техническая свобода — до 5 сабмитов в день, возможность экспериментировать
• Общий призовой фонд — 2 500 000 рублей

Приглашают студентов, исследователей, ML-инженеров — всех, кто хочет испытать свои силы на реальных данных и создать алгоритм, который работает в условиях, максимально приближенных к контентной жизни.

Регистрация открыта до 15 декабря. Успейте подать заявку, скачать датасет и начать эксперименты!

👉 Подробности и регистрация на сайте
👍31
Мысли про накрутку опыта в резюме

Я категорически против накрутки - это мое мнение, приведу аргументы к нему.

Я сейчас буду говорить про явное вранье, по подобию "2 года работаю аналитиком", хотя за плечами только пройденные курсы и к аналитике вы никогда никакого отношения не имели.

И это стоит отделять от адаптации опыта с заменой ключевых слов просто для прохождения автоматических фильтров, если у вас действительно есть схожий коммерческий опыт, вы выполняли подобные задачи или частично использовали те инструменты на работе, которые требуются для вашей целевой позиции. Адаптация обычно нужна, когда переходишь из одной сферы в другую (например из тестировщика в аналитика или из аналитика данных в инженера данных) - там действительно в задачах может быть много чего общего и релевантный опыт нужно показать.

Сейчас рынок непростой - соискателей много, конкуренция большая. Компании требуют кандидатов с опытом. Все это с одной стороны является причиной почему соискатели начинают накручивать - "я без накрутки ничего найти не могу". С другой стороны есть целая пропаганда уже на рынке от авторов своих блогов в формате "хочешь найти работу, обязан накрутить опыт!"

Выбор у каждого конечно свой, и историй кто нашел работу без накрутки и с накруткой тоже достаточно, и неуспешных кейсов много. Я лишь выскажу свое мнение

1️⃣ Кандидатов с накрученным опытом сразу видно
Знаете это как картинка или мемы "ожидание - реальность". Вот кандидаты обычно выглядят на собеседовании также: на словах я Лев Толстой, а на деле ...
Когда человек теряется:
- начинаешь спрашивать чем он реально занимался на работе
- задаешь нетипичные технические вопросы, которые отражены в опыте и вроде как должны быть знакомы
Если вас не рассекретили, либо вы талантливый лгун, либо вопросы к собеседующим, либо они на это изначально готовы были закрыть глаза.

2️⃣ Даже если кандидат прошел успешно техничку. Вранье - сам по себе отрицательный признак, который по естественным соображением отталкивает людей.
Поэтому даже если ты прошел техническое собеседование, но кто-то (рекрутер, собеседующий) все таки сомневается в реальности твоего резюме - скорее всего на позицию продолжат искать других кандидатов, а ты будешь сидеть в ожидании обратной связи или словишь отказ.

3️⃣ Внутренняя мораль
Я бы не хотел начинать свои рабочие отношения с лютого вранья. Привык придерживаться мнения: "поступай так, как хочешь чтобы поступали с тобой". Я не хочу прийти к профильному специалисту и получить ужасный сервис, просто потому что его опыт по факту является накрученным, а работодатель либо этого не заметил, либо закрыл на это глаза и даже не стал обучать специалиста.

4️⃣ Изначально такой кандидат может подставить своих коллег по работе
Также я не хочу как лид взять в свою команду к примеру мидла и через неделю его работы понять, что он и на джуна еле тянет и в него нужно вбухать ресурсы чтобы вырастить еще до мидла. Одно дело когда ты этого ожидаешь и у тебя заложено время на обучение сотрудника до нужного уровня, а другое дело когда получаешь такого кота в мешке и у тебя начинают из-за этого гореть задачи, KPI и все прочее. Поэтому я не готов на накрутку закрывать глаза.

5️⃣ Бан от компаний
Компания может без проблем сделать запрос на ваше предыдущее место работы. И если есть несостыковка с вашим резюме - есть риск улететь в черный список для компании. Такие истории есть, от рекрутеров знаю эту информацию.


Поэтому я за то, чтобы лучше сказать правду примерно в таком формате
К сожалению, у меня нет или очень мало коммерческого опыта в этой роли, я только начинаю свой путь в этой сфере. Я могу опираться на свой опыт из предыдущей сферы деятельности, а также свои теоретические и практические знания с обучения и выполнения учебных проектов с реальными инструментами.
Однако, я готов быстро погрузиться в рабочие задачи, изучить что потребуется для успешной работы в вашей компании.
Решил, что будет лучше сказать правду о своем опыте и быть готовым к быстрому погружению в проект, чем представлять неправдивый опыт в своем резюме.
👍157🫡4🔥1👀1
Интегрировать AI в аналитику. Мигрировать данные без потерь. Масштабировать на тысячи пользователей.

Три задачи, с которыми сталкивается каждая команда. Yandex DataLens Festival — про то, как их решать. Неделя глубокого погружения в аналитику — с 8 по 16 декабря, онлайн и бесплатно 👌

Разберут то, что реально пригодится в работе: от AI-инструментов DataLens до современных подходов к аналитике. Формат без воды: практические гайды и прямой эфир с командой продукта. Плюс конкурсные задания с призами.

Бонус: офлайн-афтепати в Москве для тех, кто хочет отвлечься от экрана и пообщаться вживую.

Пройти регистрацию
🔥7👍3
В среду в 19:00 буду вести вебинар на тему «Как новичку получить опыт и собрать портфолио, которое реально продает»

Вебинар организует школа Simulative, на нем обсудим

🔵 Чек-лист: как оформить портфолио, чтобы его заметили
🔵 Разбор глазами работодателя: как оценивают ваш опыт по портфолио
🔵 Как и где находить проекты, которых нет у других
🔵 Примеры проекты студентов Simulative, которые помогли получить работу

Материалы будут полезны всем кто хочет усилить или создать свое портфолио для поиска работы.

Обязательно приходи послушать!
4👍3
Retention Rate - метрика, которая показывает долю клиентов, которые продолжают пользоваться продуктов (покупать или совершать другое целевое действие) спустя какое-то время после их первого взаимодействия с продуктом. Эта метрика позволяет бизнесу оценить по-другому возвращаемость клиентов в компанию. Как и в RFM это важно смотреть, когда бизнес-модель предполагает, чтобы клиенты возвращались: делали повторные покупки, продляли подписку, покупали следующий абонемент и т.п.

Когорты и когортный анализ - это метод анализ, когда клиентов объединяют одним признаком по дате совершения действия в одну группу (когорту) и считают метрику для когорты в целом, а не для конкретного клиента.
Например, нас интересует вопрос, покупали ли повторно клиенты, которые совершили свой первый заказ в январе 2025. Все люди с первой покупкой в январе 2025 объединятся в одну когорту. И для этой когорты будет посчитано какая доля людей покупала в феврале, марте, апреле...
Таким образом все клиенты объединяются по какому-то признаку, например как дата первого заказа. И далее.
5👍3