5 ошибок новичков при создании дашбордов
Последнее видео в уходящем году! BI-эксперт Анастасия Кузнецова проанализировала более 3 000 студенческих проектов и свела все ошибки к пяти основным, на которые вы можете обратить внимание при разработке своих дашбордов.
Смотрите там, где удобно:
📹 YouTube
📺 VK Видео
📊 Simulative
Последнее видео в уходящем году! BI-эксперт Анастасия Кузнецова проанализировала более 3 000 студенческих проектов и свела все ошибки к пяти основным, на которые вы можете обратить внимание при разработке своих дашбордов.
Смотрите там, где удобно:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥3 1
Доедаем салаты и читаем статьи Simulative
Делимся большой подборкой лучших статей — 2025 из нашего блога. Сохраняйте к себе и читайте на досуге:
📖 Обзор популярных алгоритмов машинного обучения
📖 Power BI: начало работы
📖 Основы визуализации данных: виды, способы и инструменты построения графиков
📖 CTE: для чего нужна временная таблица в SQL
📖 Библиотека Pandas в Python: что это и как работает
📖 От гистограммы до тепловой карты: исследуем Seaborn
📊 Simulative
Делимся большой подборкой лучших статей — 2025 из нашего блога. Сохраняйте к себе и читайте на досуге:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥4👍1 1
Продлеваем предновогоднюю акцию!
🎄 Скидки до 35% сохраняются на все курсы (кроме тренингов) и будут действовать до 11 января. А присоединиться к обучению можно, не дожидаясь старта потока, в день оплаты!
Карьера вашей мечты совсем близко, стоит только нажать кнопку 😉
🔸 Присоединиться к обучению
📊 Simulative
🎄 Скидки до 35% сохраняются на все курсы (кроме тренингов) и будут действовать до 11 января. А присоединиться к обучению можно, не дожидаясь старта потока, в день оплаты!
Карьера вашей мечты совсем близко, стоит только нажать кнопку 😉
🔸 Присоединиться к обучению
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥1 1
Ошибка фильтрации в SQL
Одна из самых распространённых ошибок в SQL — неправильная фильтрация данных, если в столбце присутствуют значения
Например, у нас в курсе есть лёгкая задачка — отфильтровать всех пользователей, у которых поле company_id не равно 1. При этом в этом поле у многих записей стоит
Обычно студенты пишут такой запрос:
И вроде бы всё логично, но если проверить внимательно, то мы увидим, что потерялось около 80% записей!
#️⃣ Почему так происходит
Если мы обратимся к документации, то в описании оператора
А теперь идем в документацию оператора != и видим:
Таким образом, получается, что все строки с
#️⃣ Как исправить
Исправить это можно, например, с помощью оператора
Теперь вы на 100% знаете, почему эта ошибка возникает и как с ней бороться. Будьте внимательны — на больших данных обнаружить её очень сложно, а она может привести к ужасным погрешностям при расчётах.
Ставьте🔥 , если полезно!
📊 Simulative
Одна из самых распространённых ошибок в SQL — неправильная фильтрация данных, если в столбце присутствуют значения
null. Например, у нас в курсе есть лёгкая задачка — отфильтровать всех пользователей, у которых поле company_id не равно 1. При этом в этом поле у многих записей стоит
null.Обычно студенты пишут такой запрос:
SELECT *
FROM users
WHERE company_id != 1
И вроде бы всё логично, но если проверить внимательно, то мы увидим, что потерялось около 80% записей!
Если мы обратимся к документации, то в описании оператора
WHERE увидим: Синтаксис оператора: WHERE «условие». «условие» — это любое выражение типа boolean. Всё, что не true, исключается из результата.
А теперь идем в документацию оператора != и видим:
Если один из элементов сравнения равен null, то возвращается null, а не true/false.
Таким образом, получается, что все строки с
null выпадают из выборки, потому что такое сравнение возвращает null, а фильтр WHERE такие строки игнорирует. Исправить это можно, например, с помощью оператора
COALESCE, который заменит null на другое число (например, -1, т. к. его гарантированно не будет в этом столбце):SELECT *
FROM users
WHERE COALESCE(company_id, -1) != 1
Теперь вы на 100% знаете, почему эта ошибка возникает и как с ней бороться. Будьте внимательны — на больших данных обнаружить её очень сложно, а она может привести к ужасным погрешностям при расчётах.
Ставьте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍5❤4 2
Сохраняйте шпаргалку по работе с файлами в Python
Начинаем год с полезных материалов! Работа с файлами в Python — это важная часть обработки данных и автоматизации задач. Мы подготовили для вас базовую шпаргалку с основными операциями для работы с файлами:
➖ Открытие файла для чтения;
➖ Чтение по строкам;
➖ Запись в файл;
➖ Добавление в файл;
➖ Чтение и запись в бинарных файлах;
➖ Работа с контекстом;
➖ Проверка наличия файла;
➖ Удаление файла;
➖ Создание директории;
➖ Список файлов в директории;
➖ Использование библиотеки shutil;
➖ Использование библиотеки os.
Для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!
👑 Получить материал
📊 Simulative
Начинаем год с полезных материалов! Работа с файлами в Python — это важная часть обработки данных и автоматизации задач. Мы подготовили для вас базовую шпаргалку с основными операциями для работы с файлами:
Для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍4🔥2
Старты потоков в январе 🎄
Отдых отдыхом, а планировать обучение лучше заранее. Приготовили для вас старты потоков на январь — переходите по ссылкам и бронируйте место!
Сохраняйте к себе, делитесь с коллегами, и ждём вас на наших курсах!
📊 Simulative
Отдых отдыхом, а планировать обучение лучше заранее. Приготовили для вас старты потоков на январь — переходите по ссылкам и бронируйте место!
13 января🍊 Менторская программа «Аналитик данных»
16 января🍊 Аналитик данных🍊 BI-аналитик
23 января🍊 ML-инженер🍊 Инженер данных🍊 Fullstack-аналитик
30 января🍊 Аналитик данных🍊 Авторский тренинг Анастасии Кузнецовой «Осмысленные дашборды»
Сохраняйте к себе, делитесь с коллегами, и ждём вас на наших курсах!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤2🎄2
Media is too big
VIEW IN TELEGRAM
Как фильтровать и группировать данные в SQL? Три рабочих способа
Продолжаем серию видео, где будем делиться разными рабочими фишками в SQL.
В этом видео Андрон на примере одной задачи показал, как фильтровать и группировать нужные данные, используя несколько агрегатных функций.
Смотрите там, где удобно:
📱 Нативно в Telegram ☝🏻
📱 YouTube
📱 VK Видео
📊 Simulative
Продолжаем серию видео, где будем делиться разными рабочими фишками в SQL.
В этом видео Андрон на примере одной задачи показал, как фильтровать и группировать нужные данные, используя несколько агрегатных функций.
Смотрите там, где удобно:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤4 1
Смотрим вебинары, как войти в аналитику с нуля
Отдыхать можно по-разному, и мы предлагаем сделать это время ещё и полезным💡
Собрали в одном месте вебинары 2025 года, которые помогут вам сделать первые шаги в аналитике и узнать, какая профессия вам ближе. Переходите по ссылке и начинайте путь в аналитику вместе с нами!
⌨️ Забрать записи вебинаров
📊 Simulative
Отдыхать можно по-разному, и мы предлагаем сделать это время ещё и полезным
Собрали в одном месте вебинары 2025 года, которые помогут вам сделать первые шаги в аналитике и узнать, какая профессия вам ближе. Переходите по ссылке и начинайте путь в аналитику вместе с нами!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3 2
Базовая шпаргалка по Pandas 🐼
Pandas — один из самых основных и важных инструментов для работы с данными в Python. Он предоставляет множество удобных функций для загрузки, обработки, и анализа данных.
Делимся с вами шпаргалкой со всеми основными функциями, которые пригодятся вам в повседневной работе с Pandas:
➖ Импорт данных: загрузка данных из разных источников;
➖ Исследование данных: ознакомление с данными, просмотр первых и последних строк, получение информации о типах данных;
➖ Извлечение информации из датафреймов: выбор столбцов и строк, выполнение различных операций;
➖ Добавление и удаление данных: добавление новых столбцов и строк, удаление лишних данных;
➖ Фильтрация: выбор данных по условию, множественные условия;
➖ Сортировка: сортировка данных по столбцам, множественная сортировка;
➖ Агрегирование: группировка данных, вычисление статистических показателей, подсчет уникальных значений.
И для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!
📊 Simulative
Pandas — один из самых основных и важных инструментов для работы с данными в Python. Он предоставляет множество удобных функций для загрузки, обработки, и анализа данных.
Делимся с вами шпаргалкой со всеми основными функциями, которые пригодятся вам в повседневной работе с Pandas:
И для удобства мы сделали для вас notebook с примерами кода. Сохраняйте и пользуйтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥2 2
Псс, интересует переход в другую сферу?
Да, из аналитика можно переквалифицироваться в другие профессии — например, в инженеры данных или ML-специалисты. Отобрали записи наших вебинаров, где подробно разбираем эту тему — смотрите в любое удобное время!
😶 Забрать записи вебинаров
📊 Simulative
Да, из аналитика можно переквалифицироваться в другие профессии — например, в инженеры данных или ML-специалисты. Отобрали записи наших вебинаров, где подробно разбираем эту тему — смотрите в любое удобное время!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥2 2
Проекты наших студентов за год
В 2025 году мы восторгались работами наших студентов и делились ими с вами. Сегодня покажем вам несколько примеров, которые лучше любых слов объясняют, что такое реальная аналитика для бизнеса:
🔥 ETL-конвейер для маркетплейса
🔥 Аналитическая инфраструктура с глубокой аналитикой
🔥 Автоматизированный мониторинг в Yandex DataLens
Что общего во всех этих работах?
➖ Данные приходят сами, а отчёты формируются без участия человека.
➖ Используются именно те инструменты (PostgreSQL, Metabase, DataLens, Docker, Git), которые требуются на работе.
➖ За каждой строчкой кода стоит конкретный бизнес-вопрос: что продавать, кому и как удержать клиентов.
➖ Полный цикл от сбора «сырых» данных до презентации готовых инсайтов.
Эти проекты — и портфолио, с которым наши выпускники приходят к работодателям, и доказательство того, что наши студенты умеют создавать аналитические продукты.
✅ Записаться на курс
📊 Simulative
В 2025 году мы восторгались работами наших студентов и делились ими с вами. Сегодня покажем вам несколько примеров, которые лучше любых слов объясняют, что такое реальная аналитика для бизнеса:
Что общего во всех этих работах?
Эти проекты — и портфолио, с которым наши выпускники приходят к работодателям, и доказательство того, что наши студенты умеют создавать аналитические продукты.
Хотите так же? Приходите на наш курс «Аналитик данных» — это среда, где вас поддержат, направят и научат думать как аналитик. Вы не просто решаете задачи, а становитесь частью команды, которая создаёт ценность из данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥5 1
Хотите прокачать свои навыки в аналитике?
Если вы не успели посмотреть «хардовые» вебинары 2025 года, не беда — мы всё сохранили! Переходите по ссылке и получите записи вебинаров по практическому SQL и Python, а также разбору тестовых заданий на аналитика в бигтех🔥
➡️ Забрать записи вебинаров
📊 Simulative
Если вы не успели посмотреть «хардовые» вебинары 2025 года, не беда — мы всё сохранили! Переходите по ссылке и получите записи вебинаров по практическому SQL и Python, а также разбору тестовых заданий на аналитика в бигтех
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤3 1
Как превратить данные в нарратив 📈
Если вы уже умеете строить дашборды в Power BI, но чувствуете, что ваши отчёты не заходят — возможно, дело не в данных, а в их подаче. И тут на помощь приходит дата-сторителлинг.
В нашей новой статье разбираем, как строить историю через дашборд:
🟠 Трёхактная структура: от контекста до призыва к действию;
🟠 Якорные KPI + эмоциональные индикаторы — как сразу захватить внимание;
🟠 Визуальные принципы Power BI для естественного повествования;
🟠 Типичные ошибки, которые убивают даже хорошие данные.
📌 Читать статью
📊 Simulative
Если вы уже умеете строить дашборды в Power BI, но чувствуете, что ваши отчёты не заходят — возможно, дело не в данных, а в их подаче. И тут на помощь приходит дата-сторителлинг.
В нашей новой статье разбираем, как строить историю через дашборд:
📌 Читать статью
А если вы хотите углубиться в создание действительно информативных и качественных графиков, приходите на тренинг Анастасии Кузнецовой «Осмысленные дашборды». Вы пройдёте весь путь от сбора требований до релиза и поддержки дашборда, укрепите свои навыки в BI и сделаете шаг вперёд в карьере 🧡
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6 4🔥1
Оптимизация SQL-запросов: как улучшить производительность запросов с помощью индексов и правильной структуры
В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.
🔸 Зачем нужны индексы?
Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.
Пример использования индекса «до»:
Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.
Пример «после»:
С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.
🔸 Разновидности индексов
1️⃣ Первичные индексы. Они создаются автоматически для столбцов с первичным ключом:
Индекс на order_id обеспечивает быструю выборку по этому полю.
2️⃣ Уникальные индексы предотвращают дублирование значений:
Это гарантирует уникальность адресов электронной почты в таблице пользователей.
3️⃣ Составные индексы cоздаются для нескольких столбцов:
Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.
🔸 Как избежать чрезмерного количества индексов
Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:
➖ Анализируйте использование запросов: создавайте индексы только для тех столбцов, которые часто используются в условиях фильтрации.
➖ Проверяйте использование индексов: используйте команду EXPLAIN для анализа выполнения запросов.
➖ Удаляйте неиспользуемые индексы: это поможет освободить место и улучшить производительность.
🔸 Примеры оптимизации запросов
1️⃣ Ускорение фильтрации с WHERE
Пример «до»:
Запрос без индекса может занять много времени.
Пример «после»:
Индекс на price ускоряет выполнение запроса.
2️⃣ Оптимизация сортировки с ORDER BY
Пример «до»:
Запрос может быть медленным без индекса.
Пример «после»:
С индексом сортировка выполняется быстрее.
3️⃣ Поиск по нескольким колонкам
Пример «до»:
Запрос может выполняться медленно без составного индекса.
Пример «после»:
Составной индекс значительно ускоряет выполнение запроса.
Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.
📊 Simulative
В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.
🔸 Зачем нужны индексы?
Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.
Пример использования индекса «до»:
SELECT * FROM employees WHERE department = 'HR';
Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.
Пример «после»:
CREATE INDEX idx_department ON employees(department);
SELECT * FROM employees WHERE department = 'HR';
С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.
🔸 Разновидности индексов
CREATE TABLE orders (
order_id SERIAL PRIMARY KEY,
customer_id INT,
order_date DATE
);
Индекс на order_id обеспечивает быструю выборку по этому полю.
CREATE UNIQUE INDEX idx_email ON users(email);
Это гарантирует уникальность адресов электронной почты в таблице пользователей.
CREATE INDEX idx_orders_customer_date ON orders(customer_id, order_date);
Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.
🔸 Как избежать чрезмерного количества индексов
Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:
🔸 Примеры оптимизации запросов
Пример «до»:
SELECT * FROM products WHERE price > 1000;
Запрос без индекса может занять много времени.
Пример «после»:
CREATE INDEX idx_price ON products(price);
SELECT * FROM products WHERE price > 1000;
Индекс на price ускоряет выполнение запроса.
Пример «до»:
SELECT name, salary FROM employees ORDER BY salary DESC;
Запрос может быть медленным без индекса.
Пример «после»:
CREATE INDEX idx_salary ON employees(salary);
SELECT name, salary FROM employees ORDER BY salary DESC;
С индексом сортировка выполняется быстрее.
Пример «до»:
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';
Запрос может выполняться медленно без составного индекса.
Пример «после»:
CREATE INDEX idx_customer_date ON orders(customer_id, order_date);
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';
Составной индекс значительно ускоряет выполнение запроса.
Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.
Нравятся наши посты? Сохраняйте к себе, пересылайте коллегам и просто поддержите нас лайком!👍
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤10🔥5
Вебинар: решаем тестовое задание в Lamoda
Приглашаем на первый вебинар этого года! Вместе с Павлом Беляевым, тимлидом команды дата-аналитиков в Яндекс eLama, решим реальное тестовое аналитика из Lamoda: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик.
➡️ Зарегистрироваться на вебинар
На вебинаре вы:
➡️ Поймёте, по каким критериям нанимающий аналитик отличает «сырых» джунов от тех, кого уже можно нанимать;
➡️ Сформируете представление о базовых SQL‑навыках и типах задач, которые требуются от junior-аналитика;
➡️ Получите подборку материалов о том, где искать другие тестовые и другие материалы для подготовки к собеседованиям.
❗️ Встречаемся 13 января в 19:00 МСК!
➡️ Зарегистрироваться на вебинар
📊 Simulative
Приглашаем на первый вебинар этого года! Вместе с Павлом Беляевым, тимлидом команды дата-аналитиков в Яндекс eLama, решим реальное тестовое аналитика из Lamoda: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик.
На вебинаре вы:
💬 Всем зарегистрировавшимся дарим полезный материал — разбор одной из ключевых задач с собеседований по SQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥4 2
5 инструментов инженера данных
Когда речь заходит о профессии инженера данных, многие представляют себе что-то сложное и техническое. Но на самом деле всё сводится к набору мощных инструментов, с помощью которых инженер превращает хаотичные потоки данных в чётко выстроенные процессы.
Chief Data Officer Георгий Семенов собрал в статье пять ключевых инструментов, без которых не обходится ни один современный дата-инженер. Разберём, зачем они нужны и как связаны между собой.
📖 Читать статью
📊 Simulative
Когда речь заходит о профессии инженера данных, многие представляют себе что-то сложное и техническое. Но на самом деле всё сводится к набору мощных инструментов, с помощью которых инженер превращает хаотичные потоки данных в чётко выстроенные процессы.
Chief Data Officer Георгий Семенов собрал в статье пять ключевых инструментов, без которых не обходится ни один современный дата-инженер. Разберём, зачем они нужны и как связаны между собой.
📖 Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3 2
Последний день, чтобы успеть!
Говорим акции «до свидания» уже сегодня в 23:59! Сделайте мощный шаг в аналитику со скидкой:
😶 Скидки до 35% на все курсы (кроме тренингов);
😶 Не ждите старта потока — начать учиться можно в день оплаты;
😶 Подарок себе на Новый год, который изменит карьеру.
Не откладывайте мечту о сильной профессии и высокой зарплате на потом. «Потом» начинается сегодня!
🔸 Забрать скидку до 35%
📊 Simulative
Говорим акции «до свидания» уже сегодня в 23:59! Сделайте мощный шаг в аналитику со скидкой:
Не откладывайте мечту о сильной профессии и высокой зарплате на потом. «Потом» начинается сегодня!
🔸 Забрать скидку до 35%
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥2 2
5 ошибок в пет-проектах
Всем привет! На связи Андрон, основатель Simulative 👋🏻
Через меня проходит много пет-проектов, и я выделил топ-5 ошибок, которые встречаются практически в каждом. Проверьте себя, нет ли таких грешков в ваших проектах?)
Где размещать проект
Кто-то присылает ссылку на google colab, кто-то блокнот ipynb, кто-то архив, кто-то py-файл... Короче, кто во что горазд.
Есть только единственный вменяемый способ поделиться проектом — публичный репозиторий на GitHub. Если мне нужно сделать что-то кроме
Необходимые библиотеки
Если вы используете специализированные библиотеки в своём коде, то обязательно создавайте в корне проекта файлик
Это нужно, потому что любой проект я разверну так:
Склонил репозиторий → перешёл в папку → создал виртуальное окружение → активировал его → установил зависимости. После этого ваш скрипт у меня запустится без проблем.
Мусор в репозитории
Есть ребята, кто размещают проекты на GitHub, но там много мусора. Запомните: в репе не должно быть папок
Описание, как работает проект
Сделайте хотя бы минимальный Readme-файл. В нём запишите минимальные системные требования (не все библиотеки работают на всех ОС + есть ограничения по версиям питона), как запустить код, где лежат данные, какие входные аргументы, как их менять и что они значат, что вообще код делает. В общем, простой мануал для тех, кто первый раз видит ваш проект.
Хардкодинг пути до файла
Частая история — у автора кода на домашнем компьютере файлик лежит в папке
Хорошая практика — делать путь относительным, в формате «файл
Если кому-то эта инфа актуальна сейчас, обязательно поделитесь этим постом, чтобы в мире стало больше хорошо оформленных проектов 🎶
📊 Simulative
Всем привет! На связи Андрон, основатель Simulative 👋🏻
Через меня проходит много пет-проектов, и я выделил топ-5 ошибок, которые встречаются практически в каждом. Проверьте себя, нет ли таких грешков в ваших проектах?)
Где размещать проект
Кто-то присылает ссылку на google colab, кто-то блокнот ipynb, кто-то архив, кто-то py-файл... Короче, кто во что горазд.
Есть только единственный вменяемый способ поделиться проектом — публичный репозиторий на GitHub. Если мне нужно сделать что-то кроме
git clone ... — значит такой проект можно дальше не смотреть.Необходимые библиотеки
Если вы используете специализированные библиотеки в своём коде, то обязательно создавайте в корне проекта файлик
requirements.txt со списком актуальных библиотек и их версий. Это очень легко можно сделать, если перед пушем проекта на гит выполнить команду pip freeze > requirements.txt (только нужно делать это, активировав виртуальное окружение).Это нужно, потому что любой проект я разверну так:
git clone https://github.com/...
cd projectname
python -m venv venv
./venv/scripts/activate
pip install -r requirements.txt
Склонил репозиторий → перешёл в папку → создал виртуальное окружение → активировал его → установил зависимости. После этого ваш скрипт у меня запустится без проблем.
Мусор в репозитории
Есть ребята, кто размещают проекты на GitHub, но там много мусора. Запомните: в репе не должно быть папок
venv, .idea, __pycache__ и прочих прелестей. Это всё должно добавляться в .gitignore.Описание, как работает проект
Сделайте хотя бы минимальный Readme-файл. В нём запишите минимальные системные требования (не все библиотеки работают на всех ОС + есть ограничения по версиям питона), как запустить код, где лежат данные, какие входные аргументы, как их менять и что они значат, что вообще код делает. В общем, простой мануал для тех, кто первый раз видит ваш проект.
Хардкодинг пути до файла
Частая история — у автора кода на домашнем компьютере файлик лежит в папке
C:/Desktop/pussycat/data.txt. И именно этот путь он зашивает в код. А у меня на компьютере может не быть диска C и уж точно папки pussycat.Хорошая практика — делать путь относительным, в формате «файл
data.txt на одном уровне с текущим файлом с кодом» .Это делается с помощью того же модуля os.Если кому-то эта инфа актуальна сейчас, обязательно поделитесь этим постом, чтобы в мире стало больше хорошо оформленных проектов 🎶
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19🔥8👍3 3
Практическое руководство по тестированию своего дашборда
Вы создали дашборд — подключили данные, сделали красивые графики работающие фильтры. Но как быть уверенным, что в нём нет ошибок, им удобно пользоваться, а под нагрузкой он не упадёт?
Часто проблемы всплывают уже после сдачи работы, когда дашборд попадает к конечным пользователям. Чтобы этого не случилось, нужна системная проверка.
Мы подготовили для вас методичку «Типы тестирования дашбордов» от Анастасии Кузнецовой, эксперта по BI и визуализации данных и автора тренинга «Осмысленные дашборды».
Что внутри:
✅ Как оценить, понятен ли дашборд с первого взгляда по «правилу пяти секунд».
✅ Основные типы тестирования: UX-тестирование, тестирование данных, фильтров и параметров — разбор частых ошибок и проверка всех комбинаций.
✅ Как убедиться, что дашборд выдержит большие данные и много пользователей.
✅ Готовый чек-лист для быстрой пошаговой проверки любого дашборда.
Зачем это читать?
🔹 Научитесь системно проверять дашборды.
🔹 Узнаете, как находить и устранять ошибки в данных и логике до того, как их увидит бизнес.
🔹 Сэкономите часы на отладке и получите уверенность в качестве своего продукта.
Не оставляйте качество ваших дашбордов на волю случая. Берите готовую методику и внедряйте её в свои проекты!
🧡 Получить материал
📊 Simulative
Вы создали дашборд — подключили данные, сделали красивые графики работающие фильтры. Но как быть уверенным, что в нём нет ошибок, им удобно пользоваться, а под нагрузкой он не упадёт?
Часто проблемы всплывают уже после сдачи работы, когда дашборд попадает к конечным пользователям. Чтобы этого не случилось, нужна системная проверка.
Мы подготовили для вас методичку «Типы тестирования дашбордов» от Анастасии Кузнецовой, эксперта по BI и визуализации данных и автора тренинга «Осмысленные дашборды».
Что внутри:
Зачем это читать?
🔹 Научитесь системно проверять дашборды.
🔹 Узнаете, как находить и устранять ошибки в данных и логике до того, как их увидит бизнес.
🔹 Сэкономите часы на отладке и получите уверенность в качестве своего продукта.
Не оставляйте качество ваших дашбордов на волю случая. Берите готовую методику и внедряйте её в свои проекты!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥2 2
Вебинары этой недели
Ждём вас на первых вебинарах в этом году! Разбираем тестовые задания на аналитика и решаем, когда использовать Excel, а где SQL и Python🧡
Регистрируйтесь и добавляйте события к себе в календарь, чтобы не забыть!
📊 Simulative
Ждём вас на первых вебинарах в этом году! Разбираем тестовые задания на аналитика и решаем, когда использовать Excel, а где SQL и Python
#️⃣ 13 января, 19:00 МСК — «Разбираем тестовое на аналитика данных в Lamoda»
На вебинаре решим реальное тестовое аналитика: разберём структуру заказов и позиций, посчитаем нужные метрики и увидим, как к таким задачам подходит практикующий аналитик. За разбор отвечает Павел Беляев — тимлид команды дата‑аналитиков в Яндекс eLama.➡️ Зарегистрироваться на вебинар
#️⃣ 14 января, 19:00 МСК — «Когда Excel недостаточно: 5 бизнес-кейсов, в которых вам пора перейти на SQL и Python»
Разберём на коротких кейсах из практики, когда таблички уже не справляются, а пара простых скриптов на Python и запросов на SQL экономят часы рутины, помогают строить финансовые модели и выглядеть сильнее на рынке труда. Вебинар проведёт Вугар Дамиров, Data Analyst Team Lead: он каждый день решает бизнес‑задачи с помощью SQL, Python и BI.➡️ Зарегистрироваться на вебинар
Регистрируйтесь и добавляйте события к себе в календарь, чтобы не забыть!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥2 2