Simulative – Telegram

Simulative

@simulative_official

7.37K subscribers

1.73K photos

73 videos

1 file

1.31K links

Привет! Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support

Download Telegram

About

Blog

Apps

Platform

7.37K subscribers

5 ошибок новичков при создании дашбордов

Последнее видео в уходящем году! BI-эксперт Анастасия Кузнецова проанализировала более 3 000 студенческих проектов и свела все ошибки к пяти основным, на которые вы можете обратить внимание при разработке своих дашбордов.

Смотрите там, где удобно:

📹

📺

VK Видео

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10🔥31

1.48K views12:05

Доедаем салаты и читаем статьи Simulative

Делимся большой подборкой лучших статей — 2025 из нашего блога. Сохраняйте к себе и читайте на досуге:

📖

Обзор популярных алгоритмов машинного обучения

📖

Power BI: начало работы

📖

Основы визуализации данных: виды, способы и инструменты построения графиков

📖

CTE: для чего нужна временная таблица в SQL

📖

Библиотека Pandas в Python: что это и как работает

📖

От гистограммы до тепловой карты: исследуем Seaborn

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7🔥4👍11

1.28K views11:05

Продлеваем предновогоднюю акцию!

🎄 Скидки до 35% сохраняются на все курсы (кроме тренингов) и будут действовать до 11 января. А присоединиться к обучению можно, не дожидаясь старта потока, в день оплаты!

Карьера вашей мечты совсем близко, стоит только нажать кнопку 😉

🔸 Присоединиться к обучению

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥11

1.21K views09:05

Ошибка фильтрации в SQL

Одна из самых распространённых ошибок в SQL — неправильная фильтрация данных, если в столбце присутствуют значения null.

Например, у нас в курсе есть лёгкая задачка — отфильтровать всех пользователей, у которых поле company_id не равно 1. При этом в этом поле у многих записей стоит null.

Обычно студенты пишут такой запрос:

SELECT *
FROM users 
WHERE company_id != 1

И вроде бы всё логично, но если проверить внимательно, то мы увидим, что потерялось около 80% записей!

#️⃣

Почему так происходит

Если мы обратимся к документации, то в описании оператора WHERE увидим:

Синтаксис оператора: WHERE «условие». «условие» — это любое выражение типа boolean. Всё, что не true, исключается из результата.

А теперь идем в документацию оператора != и видим:

Если один из элементов сравнения равен null, то возвращается null, а не true/false.

Таким образом, получается, что все строки с null выпадают из выборки, потому что такое сравнение возвращает null, а фильтр WHERE такие строки игнорирует.

#️⃣

Как исправить

Исправить это можно, например, с помощью оператора COALESCE, который заменит null на другое число (например, -1, т. к. его гарантированно не будет в этом столбце):

SELECT *
FROM users 
WHERE COALESCE(company_id, -1) != 1

Теперь вы на 100% знаете, почему эта ошибка возникает и как с ней бороться. Будьте внимательны — на больших данных обнаружить её очень сложно, а она может привести к ужасным погрешностям при расчётах.

Ставьте 🔥, если полезно!

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥41👍5❤42

1.32K views11:05

Сохраняйте шпаргалку по работе с файлами в Python

Начинаем год с полезных материалов! Работа с файлами в Python — это важная часть обработки данных и автоматизации задач. Мы подготовили для вас базовую шпаргалку с основными операциями для работы с файлами:

➖ Открытие файла для чтения;
➖ Чтение по строкам;
➖ Запись в файл;
➖ Добавление в файл;
➖ Чтение и запись в бинарных файлах;
➖ Работа с контекстом;
➖ Проверка наличия файла;
➖ Удаление файла;
➖ Создание директории;
➖ Список файлов в директории;
➖ Использование библиотеки shutil;
➖ Использование библиотеки os.

Для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!

👑

Получить материал

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍4🔥2

1.37K views11:05

Старты потоков в январе

🎄

Отдых отдыхом, а планировать обучение лучше заранее. Приготовили для вас старты потоков на январь — переходите по ссылкам и бронируйте место!

13 января

🍊 Менторская программа «Аналитик данных»

16 января

🍊 Аналитик данных

🍊 BI-аналитик

23 января

🍊 ML-инженер

🍊 Инженер данных

🍊 Fullstack-аналитик

30 января

🍊 Аналитик данных

🍊 Авторский тренинг Анастасии Кузнецовой «Осмысленные дашборды»

Сохраняйте к себе, делитесь с коллегами, и ждём вас на наших курсах!

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤2🎄2

1.15K viewsedited 07:05

Media is too big

VIEW IN TELEGRAM

Как фильтровать и группировать данные в SQL? Три рабочих способа

Продолжаем серию видео, где будем делиться разными рабочими фишками в SQL.

В этом видео Андрон на примере одной задачи показал, как фильтровать и группировать нужные данные, используя несколько агрегатных функций.

Смотрите там, где удобно:
📱 Нативно в Telegram ☝🏻

📱

📱

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤41

1.12K views09:05

Смотрим вебинары, как войти в аналитику с нуля

Отдыхать можно по-разному, и мы предлагаем сделать это время ещё и полезным 💡

Собрали в одном месте вебинары 2025 года, которые помогут вам сделать первые шаги в аналитике и узнать, какая профессия вам ближе. Переходите по ссылке и начинайте путь в аналитику вместе с нами!

⌨️

Забрать записи вебинаров

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥32

1.14K views08:05

Базовая шпаргалка по Pandas 🐼

Pandas — один из самых основных и важных инструментов для работы с данными в Python. Он предоставляет множество удобных функций для загрузки, обработки, и анализа данных.

Делимся с вами шпаргалкой со всеми основными функциями, которые пригодятся вам в повседневной работе с Pandas:

➖

Импорт данных: загрузка данных из разных источников;

➖

Исследование данных: ознакомление с данными, просмотр первых и последних строк, получение информации о типах данных;

➖

Извлечение информации из датафреймов: выбор столбцов и строк, выполнение различных операций;

➖

Добавление и удаление данных: добавление новых столбцов и строк, удаление лишних данных;

➖

Фильтрация: выбор данных по условию, множественные условия;

➖

Сортировка: сортировка данных по столбцам, множественная сортировка;

➖

Агрегирование: группировка данных, вычисление статистических показателей, подсчет уникальных значений.

И для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2🔥22

1.26K views10:05

Псс, интересует переход в другую сферу?

Да, из аналитика можно переквалифицироваться в другие профессии — например, в инженеры данных или ML-специалисты. Отобрали записи наших вебинаров, где подробно разбираем эту тему — смотрите в любое удобное время!

😶

Забрать записи вебинаров

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥22

1.17K views08:05

Проекты наших студентов за год

В 2025 году мы восторгались работами наших студентов и делились ими с вами. Сегодня покажем вам несколько примеров, которые лучше любых слов объясняют, что такое реальная аналитика для бизнеса:

🔥

ETL-конвейер для маркетплейса

🔥

Аналитическая инфраструктура с глубокой аналитикой

🔥

Автоматизированный мониторинг в Yandex DataLens

Что общего во всех этих работах?
➖ Данные приходят сами, а отчёты формируются без участия человека.
➖ Используются именно те инструменты (PostgreSQL, Metabase, DataLens, Docker, Git), которые требуются на работе.
➖ За каждой строчкой кода стоит конкретный бизнес-вопрос: что продавать, кому и как удержать клиентов.
➖ Полный цикл от сбора «сырых» данных до презентации готовых инсайтов.

Эти проекты — и портфолио, с которым наши выпускники приходят к работодателям, и доказательство того, что наши студенты умеют создавать аналитические продукты.

Хотите так же? Приходите на наш курс «Аналитик данных» — это среда, где вас поддержат, направят и научат думать как аналитик. Вы не просто решаете задачи, а становитесь частью команды, которая создаёт ценность из данных.

✅

Записаться на курс

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥51

1.19K views10:04

Хотите прокачать свои навыки в аналитике?

Если вы не успели посмотреть «хардовые» вебинары 2025 года, не беда — мы всё сохранили! Переходите по ссылке и получите записи вебинаров по практическому SQL и Python, а также разбору тестовых заданий на аналитика в бигтех 🔥

➡️

Забрать записи вебинаров

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤31

992 views07:05

Как превратить данные в нарратив

📈

Если вы уже умеете строить дашборды в Power BI, но чувствуете, что ваши отчёты не заходят — возможно, дело не в данных, а в их подаче. И тут на помощь приходит дата-сторителлинг.

В нашей новой статье разбираем, как строить историю через дашборд:
🟠 Трёхактная структура: от контекста до призыва к действию;
🟠 Якорные KPI + эмоциональные индикаторы — как сразу захватить внимание;
🟠 Визуальные принципы Power BI для естественного повествования;
🟠 Типичные ошибки, которые убивают даже хорошие данные.

📌 Читать статью

А если вы хотите углубиться в создание действительно информативных и качественных графиков, приходите на тренинг Анастасии Кузнецовой «Осмысленные дашборды». Вы пройдёте весь путь от сбора требований до релиза и поддержки дашборда, укрепите свои навыки в BI и сделаете шаг вперёд в карьере 🧡

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤64🔥1

1.06K views09:05

Оптимизация SQL-запросов: как улучшить производительность запросов с помощью индексов и правильной структуры

В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.

🔸 Зачем нужны индексы?

Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.

Пример использования индекса «до»:

SELECT * FROM employees WHERE department = 'HR';

Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.

Пример «после»:

CREATE INDEX idx_department ON employees(department);
SELECT * FROM employees WHERE department = 'HR';

С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.

🔸 Разновидности индексов

1️⃣

Первичные индексы. Они создаются автоматически для столбцов с первичным ключом:

CREATE TABLE orders (
       order_id SERIAL PRIMARY KEY,
       customer_id INT,
       order_date DATE
);

Индекс на order_id обеспечивает быструю выборку по этому полю.

2️⃣

Уникальные индексы предотвращают дублирование значений:

CREATE UNIQUE INDEX idx_email ON users(email);

Это гарантирует уникальность адресов электронной почты в таблице пользователей.

3️⃣

Составные индексы cоздаются для нескольких столбцов:

CREATE INDEX idx_orders_customer_date ON orders(customer_id, order_date);

Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.

🔸 Как избежать чрезмерного количества индексов

Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:

➖

Анализируйте использование запросов: создавайте индексы только для тех столбцов, которые часто используются в условиях фильтрации.

➖

Проверяйте использование индексов: используйте команду EXPLAIN для анализа выполнения запросов.

➖

Удаляйте неиспользуемые индексы: это поможет освободить место и улучшить производительность.

🔸 Примеры оптимизации запросов

1️⃣

Ускорение фильтрации с WHERE

Пример «до»:

SELECT * FROM products WHERE price > 1000;

Запрос без индекса может занять много времени.

Пример «после»:

CREATE INDEX idx_price ON products(price);
SELECT * FROM products WHERE price > 1000;

Индекс на price ускоряет выполнение запроса.

2️⃣

Оптимизация сортировки с ORDER BY

Пример «до»:

SELECT name, salary FROM employees ORDER BY salary DESC;

Запрос может быть медленным без индекса.

Пример «после»:

CREATE INDEX idx_salary ON employees(salary);
SELECT name, salary FROM employees ORDER BY salary DESC;

С индексом сортировка выполняется быстрее.

3️⃣

Поиск по нескольким колонкам

Пример «до»:

SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';

Запрос может выполняться медленно без составного индекса.

Пример «после»:

CREATE INDEX idx_customer_date ON orders(customer_id, order_date);
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';

Составной индекс значительно ускоряет выполнение запроса.

Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.

Нравятся наши посты? Сохраняйте к себе, пересылайте коллегам и просто поддержите нас лайком! 👍

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25❤10🔥5

1.21K views11:05

Вебинар: решаем тестовое задание в Lamoda

Приглашаем на первый вебинар этого года! Вместе с Павлом Беляевым, тимлидом команды дата-аналитиков в Яндекс eLama, решим реальное тестовое аналитика из Lamoda: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик.

➡️

Зарегистрироваться на вебинар

На вебинаре вы:
➡️ Поймёте, по каким критериям нанимающий аналитик отличает «сырых» джунов от тех, кого уже можно нанимать;
➡️ Сформируете представление о базовых SQL‑навыках и типах задач, которые требуются от junior-аналитика;
➡️ Получите подборку материалов о том, где искать другие тестовые и другие материалы для подготовки к собеседованиям.

❗️ Встречаемся 13 января в 19:00 МСК!

💬 Всем зарегистрировавшимся дарим полезный материал — разбор одной из ключевых задач с собеседований по SQL.

➡️

Зарегистрироваться на вебинар

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥42

1.86K views09:05

5 инструментов инженера данных

Когда речь заходит о профессии инженера данных, многие представляют себе что-то сложное и техническое. Но на самом деле всё сводится к набору мощных инструментов, с помощью которых инженер превращает хаотичные потоки данных в чётко выстроенные процессы.

Chief Data Officer Георгий Семенов собрал в статье пять ключевых инструментов, без которых не обходится ни один современный дата-инженер. Разберём, зачем они нужны и как связаны между собой.

📖 Читать статью

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥32

1.29K views10:05

Последний день, чтобы успеть!

Говорим акции «до свидания» уже сегодня в 23:59! Сделайте мощный шаг в аналитику со скидкой:

😶 Скидки до 35% на все курсы (кроме тренингов);
😶 Не ждите старта потока — начать учиться можно в день оплаты;
😶 Подарок себе на Новый год, который изменит карьеру.

Не откладывайте мечту о сильной профессии и высокой зарплате на потом. «Потом» начинается сегодня!

🔸 Забрать скидку до 35%

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥22

1.14K views07:05

Media is too big

VIEW IN TELEGRAM

А как проходит ваше утро после праздников? 😁

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

😁9☃32

945 views06:23

5 ошибок в пет-проектах

Всем привет! На связи Андрон, основатель Simulative 👋🏻

Через меня проходит много пет-проектов, и я выделил топ-5 ошибок, которые встречаются практически в каждом. Проверьте себя, нет ли таких грешков в ваших проектах?)

Где размещать проект

Кто-то присылает ссылку на google colab, кто-то блокнот ipynb, кто-то архив, кто-то py-файл... Короче, кто во что горазд.

Есть только единственный вменяемый способ поделиться проектом — публичный репозиторий на GitHub. Если мне нужно сделать что-то кроме git clone ... — значит такой проект можно дальше не смотреть.

Необходимые библиотеки

Если вы используете специализированные библиотеки в своём коде, то обязательно создавайте в корне проекта файлик requirements.txt со списком актуальных библиотек и их версий. Это очень легко можно сделать, если перед пушем проекта на гит выполнить команду pip freeze > requirements.txt (только нужно делать это, активировав виртуальное окружение).

Это нужно, потому что любой проект я разверну так:

git clone https://github.com/...
cd projectname
python -m venv venv
./venv/scripts/activate
pip install -r requirements.txt

Склонил репозиторий → перешёл в папку → создал виртуальное окружение → активировал его → установил зависимости. После этого ваш скрипт у меня запустится без проблем.

Мусор в репозитории

Есть ребята, кто размещают проекты на GitHub, но там много мусора. Запомните: в репе не должно быть папок venv, .idea, __pycache__ и прочих прелестей. Это всё должно добавляться в .gitignore.

Описание, как работает проект

Сделайте хотя бы минимальный Readme-файл. В нём запишите минимальные системные требования (не все библиотеки работают на всех ОС + есть ограничения по версиям питона), как запустить код, где лежат данные, какие входные аргументы, как их менять и что они значат, что вообще код делает. В общем, простой мануал для тех, кто первый раз видит ваш проект.

Хардкодинг пути до файла

Частая история — у автора кода на домашнем компьютере файлик лежит в папке C:/Desktop/pussycat/data.txt. И именно этот путь он зашивает в код. А у меня на компьютере может не быть диска C и уж точно папки pussycat.

Хорошая практика — делать путь относительным, в формате «файл data.txt на одном уровне с текущим файлом с кодом» .Это делается с помощью того же модуля os.

Если кому-то эта инфа актуальна сейчас, обязательно поделитесь этим постом, чтобы в мире стало больше хорошо оформленных проектов 🎶

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤19🔥8👍33

923 views07:05

Практическое руководство по тестированию своего дашборда

Вы создали дашборд — подключили данные, сделали красивые графики работающие фильтры. Но как быть уверенным, что в нём нет ошибок, им удобно пользоваться, а под нагрузкой он не упадёт?

Часто проблемы всплывают уже после сдачи работы, когда дашборд попадает к конечным пользователям. Чтобы этого не случилось, нужна системная проверка.

Мы подготовили для вас методичку «Типы тестирования дашбордов» от Анастасии Кузнецовой, эксперта по BI и визуализации данных и автора тренинга «Осмысленные дашборды».

Что внутри:
✅ Как оценить, понятен ли дашборд с первого взгляда по «правилу пяти секунд».
✅ Основные типы тестирования: UX-тестирование, тестирование данных, фильтров и параметров — разбор частых ошибок и проверка всех комбинаций.
✅ Как убедиться, что дашборд выдержит большие данные и много пользователей.
✅ Готовый чек-лист для быстрой пошаговой проверки любого дашборда.

Зачем это читать?
🔹 Научитесь системно проверять дашборды.
🔹 Узнаете, как находить и устранять ошибки в данных и логике до того, как их увидит бизнес.
🔹 Сэкономите часы на отладке и получите уверенность в качестве своего продукта.

Не оставляйте качество ваших дашбордов на волю случая. Берите готовую методику и внедряйте её в свои проекты!

🧡

Получить материал

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥22

966 views09:05

Вебинары этой недели

Ждём вас на первых вебинарах в этом году! Разбираем тестовые задания на аналитика и решаем, когда использовать Excel, а где SQL и Python 🧡

#️⃣ 13 января, 19:00 МСК — «Разбираем тестовое на аналитика данных в Lamoda»

На вебинаре решим реальное тестовое аналитика: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик. За разбор отвечает Павел Беляев — тимлид команды дата‑аналитиков в Яндекс eLama.

➡️ Зарегистрироваться на вебинар

#️⃣ 14 января, 19:00 МСК — «Когда Excel недостаточно: 5 бизнес-кейсов, в которых вам пора перейти на SQL и Python»

Разберём на коротких кейсах из практики, когда таблички уже не справляются, а пара простых скриптов на Python и запросов на SQL экономят часы рутины, помогают строить финансовые модели и выглядеть сильнее на рынке труда. Вебинар проведёт Вугар Дамиров, Data Analyst Team Lead: он каждый день решает бизнес‑задачи с помощью SQL, Python и BI.

➡️ Зарегистрироваться на вебинар

Регистрируйтесь и добавляйте события к себе в календарь, чтобы не забыть!

📊

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥22

1K viewsedited 11:05