7.37K subscribers
1.73K photos
73 videos
1 file
1.31K links
Привет! Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support
Download Telegram
5 ошибок новичков при создании дашбордов

Последнее видео в уходящем году! BI-эксперт Анастасия Кузнецова проанализировала более 3 000 студенческих проектов и свела все ошибки к пяти основным, на которые вы можете обратить внимание при разработке своих дашбордов.

Смотрите там, где удобно:
📹 YouTube
📺 VK Видео

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥31
Продлеваем предновогоднюю акцию!

🎄 Скидки до 35% сохраняются на все курсы (кроме тренингов) и будут действовать до 11 января. А присоединиться к обучению можно, не дожидаясь старта потока, в день оплаты!

Карьера вашей мечты совсем близко, стоит только нажать кнопку 😉

🔸 Присоединиться к обучению

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥11
Ошибка фильтрации в SQL

Одна из самых распространённых ошибок в SQL — неправильная фильтрация данных, если в столбце присутствуют значения null.

Например, у нас в курсе есть лёгкая задачка — отфильтровать всех пользователей, у которых поле company_id не равно 1. При этом в этом поле у многих записей стоит null.

Обычно студенты пишут такой запрос:

SELECT *
FROM users
WHERE company_id != 1


И вроде бы всё логично, но если проверить внимательно, то мы увидим, что потерялось около 80% записей!

#️⃣ Почему так происходит

Если мы обратимся к документации, то в описании оператора WHERE увидим:

Синтаксис оператора: WHERE «условие». «условие» — это любое выражение типа boolean. Всё, что не true, исключается из результата.


А теперь идем в документацию оператора != и видим:

Если один из элементов сравнения равен null, то возвращается null, а не true/false.


Таким образом, получается, что все строки с null выпадают из выборки, потому что такое сравнение возвращает null, а фильтр WHERE такие строки игнорирует.

#️⃣ Как исправить

Исправить это можно, например, с помощью оператора COALESCE, который заменит null на другое число (например, -1, т. к. его гарантированно не будет в этом столбце):

SELECT *
FROM users
WHERE COALESCE(company_id, -1) != 1


Теперь вы на 100% знаете, почему эта ошибка возникает и как с ней бороться. Будьте внимательны — на больших данных обнаружить её очень сложно, а она может привести к ужасным погрешностям при расчётах.

Ставьте 🔥, если полезно!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍542
Сохраняйте шпаргалку по работе с файлами в Python

Начинаем год с полезных материалов! Работа с файлами в Python — это важная часть обработки данных и автоматизации задач. Мы подготовили для вас базовую шпаргалку с основными операциями для работы с файлами:

Открытие файла для чтения;
Чтение по строкам;
Запись в файл;
Добавление в файл;
Чтение и запись в бинарных файлах;
Работа с контекстом;
Проверка наличия файла;
Удаление файла;
Создание директории;
Список файлов в директории;
Использование библиотеки shutil;
Использование библиотеки os.

Для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!

👑 Получить материал

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍4🔥2
Старты потоков в январе 🎄

Отдых отдыхом, а планировать обучение лучше заранее. Приготовили для вас старты потоков на январь — переходите по ссылкам и бронируйте место!

13 января

🍊 Менторская программа «Аналитик данных»


16 января

🍊 Аналитик данных

🍊 BI-аналитик


23 января

🍊 ML-инженер

🍊 Инженер данных

🍊 Fullstack-аналитик


30 января

🍊 Аналитик данных

🍊 Авторский тренинг Анастасии Кузнецовой «Осмысленные дашборды»


Сохраняйте к себе, делитесь с коллегами, и ждём вас на наших курсах!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32🎄2
Media is too big
VIEW IN TELEGRAM
Как фильтровать и группировать данные в SQL? Три рабочих способа

Продолжаем серию видео, где будем делиться разными рабочими фишками в SQL.

В этом видео Андрон на примере одной задачи показал, как фильтровать и группировать нужные данные, используя несколько агрегатных функций.

Смотрите там, где удобно:
📱 Нативно в Telegram ☝🏻
📱 YouTube
📱 VK Видео

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥541
Смотрим вебинары, как войти в аналитику с нуля

Отдыхать можно по-разному, и мы предлагаем сделать это время ещё и полезным 💡

Собрали в одном месте вебинары 2025 года, которые помогут вам сделать первые шаги в аналитике и узнать, какая профессия вам ближе. Переходите по ссылке и начинайте путь в аналитику вместе с нами!

⌨️ Забрать записи вебинаров

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥32
Базовая шпаргалка по Pandas 🐼

Pandas — один из самых основных и важных инструментов для работы с данными в Python. Он предоставляет множество удобных функций для загрузки, обработки, и анализа данных.

Делимся с вами шпаргалкой со всеми основными функциями, которые пригодятся вам в повседневной работе с Pandas:

Импорт данных: загрузка данных из разных источников;

Исследование данных: ознакомление с данными, просмотр первых и последних строк, получение информации о типах данных;

Извлечение информации из датафреймов: выбор столбцов и строк, выполнение различных операций;

Добавление и удаление данных: добавление новых столбцов и строк, удаление лишних данных;

Фильтрация: выбор данных по условию, множественные условия;

Сортировка: сортировка данных по столбцам, множественная сортировка;

Агрегирование: группировка данных, вычисление статистических показателей, подсчет уникальных значений.

И для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥22
Псс, интересует переход в другую сферу?

Да, из аналитика можно переквалифицироваться в другие профессии — например, в инженеры данных или ML-специалисты. Отобрали записи наших вебинаров, где подробно разбираем эту тему — смотрите в любое удобное время!

😶 Забрать записи вебинаров

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥22
Проекты наших студентов за год

В 2025 году мы восторгались работами наших студентов и делились ими с вами. Сегодня покажем вам несколько примеров, которые лучше любых слов объясняют, что такое реальная аналитика для бизнеса:

🔥 ETL-конвейер для маркетплейса
🔥 Аналитическая инфраструктура с глубокой аналитикой
🔥 Автоматизированный мониторинг в Yandex DataLens

Что общего во всех этих работах?
Данные приходят сами, а отчёты формируются без участия человека.
Используются именно те инструменты (PostgreSQL, Metabase, DataLens, Docker, Git), которые требуются на работе.
За каждой строчкой кода стоит конкретный бизнес-вопрос: что продавать, кому и как удержать клиентов.
Полный цикл от сбора «сырых» данных до презентации готовых инсайтов.

Эти проекты — и портфолио, с которым наши выпускники приходят к работодателям, и доказательство того, что наши студенты умеют создавать аналитические продукты.

Хотите так же? Приходите на наш курс «Аналитик данных» — это среда, где вас поддержат, направят и научат думать как аналитик. Вы не просто решаете задачи, а становитесь частью команды, которая создаёт ценность из данных.


Записаться на курс

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥51
Хотите прокачать свои навыки в аналитике?

Если вы не успели посмотреть «хардовые» вебинары 2025 года, не беда — мы всё сохранили! Переходите по ссылке и получите записи вебинаров по практическому SQL и Python, а также разбору тестовых заданий на аналитика в бигтех 🔥

➡️ Забрать записи вебинаров

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥531
Как превратить данные в нарратив 📈

Если вы уже умеете строить дашборды в Power BI, но чувствуете, что ваши отчёты не заходят — возможно, дело не в данных, а в их подаче. И тут на помощь приходит дата-сторителлинг.

В нашей новой статье разбираем, как строить историю через дашборд:
🟠 Трёхактная структура: от контекста до призыва к действию;
🟠 Якорные KPI + эмоциональные индикаторы — как сразу захватить внимание;
🟠 Визуальные принципы Power BI для естественного повествования;
🟠 Типичные ошибки, которые убивают даже хорошие данные.

📌 Читать статью

А если вы хотите углубиться в создание действительно информативных и качественных графиков, приходите на тренинг Анастасии Кузнецовой «Осмысленные дашборды». Вы пройдёте весь путь от сбора требований до релиза и поддержки дашборда, укрепите свои навыки в BI и сделаете шаг вперёд в карьере 🧡


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
64🔥1
Оптимизация SQL-запросов: как улучшить производительность запросов с помощью индексов и правильной структуры

В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.

🔸 Зачем нужны индексы?

Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.

Пример использования индекса «до»:

SELECT * FROM employees WHERE department = 'HR';


Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.

Пример «после»:

CREATE INDEX idx_department ON employees(department);
SELECT * FROM employees WHERE department = 'HR';


С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.

🔸 Разновидности индексов

1️⃣ Первичные индексы. Они создаются автоматически для столбцов с первичным ключом:

CREATE TABLE orders (
order_id SERIAL PRIMARY KEY,
customer_id INT,
order_date DATE
);


Индекс на order_id обеспечивает быструю выборку по этому полю.

2️⃣ Уникальные индексы предотвращают дублирование значений:

CREATE UNIQUE INDEX idx_email ON users(email);


Это гарантирует уникальность адресов электронной почты в таблице пользователей.

3️⃣ Составные индексы cоздаются для нескольких столбцов:

CREATE INDEX idx_orders_customer_date ON orders(customer_id, order_date);


Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.

🔸 Как избежать чрезмерного количества индексов

Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:

Анализируйте использование запросов: создавайте индексы только для тех столбцов, которые часто используются в условиях фильтрации.
Проверяйте использование индексов: используйте команду EXPLAIN для анализа выполнения запросов.
Удаляйте неиспользуемые индексы: это поможет освободить место и улучшить производительность.

🔸 Примеры оптимизации запросов

1️⃣ Ускорение фильтрации с WHERE

Пример «до»:

SELECT * FROM products WHERE price > 1000;


Запрос без индекса может занять много времени.

Пример «после»:

CREATE INDEX idx_price ON products(price);
SELECT * FROM products WHERE price > 1000;


Индекс на price ускоряет выполнение запроса.

2️⃣ Оптимизация сортировки с ORDER BY

Пример «до»:

SELECT name, salary FROM employees ORDER BY salary DESC;


Запрос может быть медленным без индекса.

Пример «после»:

CREATE INDEX idx_salary ON employees(salary);
SELECT name, salary FROM employees ORDER BY salary DESC;


С индексом сортировка выполняется быстрее.

3️⃣ Поиск по нескольким колонкам

Пример «до»:

SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';


Запрос может выполняться медленно без составного индекса.

Пример «после»:

CREATE INDEX idx_customer_date ON orders(customer_id, order_date);
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';


Составной индекс значительно ускоряет выполнение запроса.

Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.

Нравятся наши посты? Сохраняйте к себе, пересылайте коллегам и просто поддержите нас лайком! 👍


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2510🔥5
Вебинар: решаем тестовое задание в Lamoda

Приглашаем на первый вебинар этого года! Вместе с Павлом Беляевым, тимлидом команды дата-аналитиков в Яндекс eLama, решим реальное тестовое аналитика из Lamoda: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик.

➡️ Зарегистрироваться на вебинар

На вебинаре вы:
➡️ Поймёте, по каким критериям нанимающий аналитик отличает «сырых» джунов от тех, кого уже можно нанимать;
➡️ Сформируете представление о базовых SQL‑навыках и типах задач, которые требуются от junior-аналитика;
➡️ Получите подборку материалов о том, где искать другие тестовые и другие материалы для подготовки к собеседованиям.​

❗️ Встречаемся 13 января в 19:00 МСК!

💬 Всем зарегистрировавшимся дарим полезный материал — разбор одной из ключевых задач с собеседований по SQL.


➡️ Зарегистрироваться на вебинар

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥42
5 инструментов инженера данных

Когда речь заходит о профессии инженера данных, многие представляют себе что-то сложное и техническое. Но на самом деле всё сводится к набору мощных инструментов, с помощью которых инженер превращает хаотичные потоки данных в чётко выстроенные процессы.

Chief Data Officer Георгий Семенов собрал в статье пять ключевых инструментов, без которых не обходится ни один современный дата-инженер. Разберём, зачем они нужны и как связаны между собой.

📖 Читать статью

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥32
Последний день, чтобы успеть!

Говорим акции «до свидания» уже сегодня в 23:59! Сделайте мощный шаг в аналитику со скидкой:

😶 Скидки до 35% на все курсы (кроме тренингов);
😶 Не ждите старта потока — начать учиться можно в день оплаты;
😶 Подарок себе на Новый год, который изменит карьеру.

Не откладывайте мечту о сильной профессии и высокой зарплате на потом. «Потом» начинается сегодня!

🔸 Забрать скидку до 35%

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥22
Media is too big
VIEW IN TELEGRAM
А как проходит ваше утро после праздников? 😁

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
😁932
5 ошибок в пет-проектах

Всем привет! На связи Андрон, основатель Simulative
👋🏻

Через меня проходит много пет-проектов, и я выделил топ-5 ошибок, которые встречаются практически в каждом. Проверьте себя, нет ли таких грешков в ваших проектах?)

Где размещать проект

Кто-то присылает ссылку на google colab, кто-то блокнот ipynb, кто-то архив, кто-то py-файл... Короче, кто во что горазд.

Есть только единственный вменяемый способ поделиться проектом — публичный репозиторий на GitHub. Если мне нужно сделать что-то кроме git clone ... — значит такой проект можно дальше не смотреть.

Необходимые библиотеки

Если вы используете специализированные библиотеки в своём коде, то обязательно создавайте в корне проекта файлик requirements.txt со списком актуальных библиотек и их версий. Это очень легко можно сделать, если перед пушем проекта на гит выполнить команду pip freeze > requirements.txt (только нужно делать это, активировав виртуальное окружение).

Это нужно, потому что любой проект я разверну так:

git clone https://github.com/...
cd projectname
python -m venv venv
./venv/scripts/activate
pip install -r requirements.txt


Склонил репозиторий → перешёл в папку → создал виртуальное окружение → активировал его → установил зависимости. После этого ваш скрипт у меня запустится без проблем.

Мусор в репозитории

Есть ребята, кто размещают проекты на GitHub, но там много мусора. Запомните: в репе не должно быть папок venv, .idea, __pycache__ и прочих прелестей. Это всё должно добавляться в .gitignore.

Описание, как работает проект

Сделайте хотя бы минимальный Readme-файл. В нём запишите минимальные системные требования (не все библиотеки работают на всех ОС + есть ограничения по версиям питона), как запустить код, где лежат данные, какие входные аргументы, как их менять и что они значат, что вообще код делает. В общем, простой мануал для тех, кто первый раз видит ваш проект.

Хардкодинг пути до файла

Частая история — у автора кода на домашнем компьютере файлик лежит в папке C:/Desktop/pussycat/data.txt. И именно этот путь он зашивает в код. А у меня на компьютере может не быть диска C и уж точно папки pussycat.

Хорошая практика — делать путь относительным, в формате «файл data.txt на одном уровне с текущим файлом с кодом» .Это делается с помощью того же модуля os.

Если кому-то эта инфа актуальна сейчас, обязательно поделитесь этим постом, чтобы в мире стало больше хорошо оформленных проектов 🎶

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥8👍33
Практическое руководство по тестированию своего дашборда

Вы создали дашборд — подключили данные, сделали красивые графики работающие фильтры. Но как быть уверенным, что в нём нет ошибок, им удобно пользоваться, а под нагрузкой он не упадёт?

Часто проблемы всплывают уже после сдачи работы, когда дашборд попадает к конечным пользователям. Чтобы этого не случилось, нужна системная проверка.

Мы подготовили для вас методичку «Типы тестирования дашбордов» от Анастасии Кузнецовой, эксперта по BI и визуализации данных и автора тренинга «Осмысленные дашборды».

Что внутри:
Как оценить, понятен ли дашборд с первого взгляда по «правилу пяти секунд».
Основные типы тестирования: UX-тестирование, тестирование данных, фильтров и параметров — разбор частых ошибок и проверка всех комбинаций.
Как убедиться, что дашборд выдержит большие данные и много пользователей.
Готовый чек-лист для быстрой пошаговой проверки любого дашборда.

Зачем это читать?
🔹 Научитесь системно проверять дашборды.
🔹 Узнаете, как находить и устранять ошибки в данных и логике до того, как их увидит бизнес.
🔹 Сэкономите часы на отладке и получите уверенность в качестве своего продукта.

Не оставляйте качество ваших дашбордов на волю случая. Берите готовую методику и внедряйте её в свои проекты!

🧡 Получить материал

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥22
Вебинары этой недели

Ждём вас на первых вебинарах в этом году! Разбираем тестовые задания на аналитика и решаем, когда использовать Excel, а где SQL и Python 🧡

#️⃣ 13 января, 19:00 МСК«Разбираем тестовое на аналитика данных в Lamoda»

На вебинаре решим реальное тестовое аналитика: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик. За разбор отвечает Павел Беляев — тимлид команды дата‑аналитиков в Яндекс eLama.

➡️ Зарегистрироваться на вебинар


#️⃣ 14 января, 19:00 МСК«Когда Excel недостаточно: 5 бизнес-кейсов, в которых вам пора перейти на SQL и Python»

Разберём на коротких кейсах из практики, когда таблички уже не справляются, а пара простых скриптов на Python и запросов на SQL экономят часы рутины, помогают строить финансовые модели и выглядеть сильнее на рынке труда. Вебинар проведёт Вугар Дамиров, Data Analyst Team Lead: он каждый день решает бизнес‑задачи с помощью SQL, Python и BI.

➡️ Зарегистрироваться на вебинар


Регистрируйтесь и добавляйте события к себе в календарь, чтобы не забыть!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥22