На собеседованиях часто спрашивают:
«Какие методы оптимизации SQL-запросов вы знаете?»
И спрашивают не зря. При работе с большими объёмами данных с этим сталкиваешься постоянно. В этом посте разберём базовые вещи — что такое партиционирование и индексирование и как они работают на уровне идеи. Практические примеры будут во второй части.
1) Что такое партиции?
• Представим таблицу, в которой хранятся списания клиентов банка. Объём данных там огромный. Часто кажется, что достаточно просто написать фильтр по дате, и всё будет быстро. Но если таблица большая, SQL начнёт читать её целиком — строка за строкой, проверяя условие у каждой записи. Это полный скан таблицы, и он дорогой.
• Теперь представим жизненный пример. У вас есть тысячи фотографий. Обычно люди раскладывают их по годам. И если нужно посмотреть фотографии за конкретный год, вы не открываете все остальные — сразу идёте в нужную папку и экономите время.
• Партиционирование работает точно так же. Таблица физически делится на части — партиции. Чаще всего это делают по дате. В итоге, когда мы хотим посчитать списания клиента за конкретный месяц, запрос сразу идёт только в нужный диапазон дат и не читает всё остальное. На больших объёмах данных это даёт очень ощутимый прирост.
2) Что такое индексы?
• Продолжим аналогию с фотографиями. Мы уже разложили фото по годам — стало быстрее. Но допустим, в одном году фотографий всё равно очень много, и мы хотим найти конкретные — например, с дня рождения.
• Было бы удобно иметь файл с описанием, где написано:
фото 1–10 — путешествие
фото 20–25 — день рождения
фото 40–50 — работа
По сути, это содержание книги. Именно так работают индексы.
• Индекс — это отдельная структура, которая хранит значения столбца и знает, где физически лежат строки с этими значениями. Когда в запросе используется условие в WHERE или JOIN, база данных сначала смотрит в индекс, а затем читает только нужные строки, а не всю таблицу.
• Важно понимать: индекс не уменьшает объём данных, он ускоряет поиск внутри них.
3) Партиции и индексы вместе:
• Теперь картинка складывается полностью.
Партиционирование помогает не читать лишние данные.
Индексы помогают быстро находить нужные строки.
• На практике часто делают так: таблицу партиционируют, например, по дате, а внутри каждой партиции создают индексы.
Итог:
Партиционирование физически делит большую таблицу на части.
Индексы ускоряют поиск данных внутри таблицы или партиции.
Это разные инструменты, которые дополняют друг друга.
Провожу консультации (подробности здесь):
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32❤🔥6🐳4
🎉 Итоги года и большое спасибо вам:
Хочу подвести итоги года и просто сказать спасибо.
Канал я начал активно вести с начала июля этого года.
Цель была максимально простая и понятная — набрать 1000 подписчиков до конца года.
И мы с вами эту цель перевыполнили.🚬
Почему вы не видели постов про 500 или 1000 подписчиков?🤩
Я сознательно их пропускал и ждал одно конкретное число.
📊 1106 человек. Почему именно оно для меня важно:
• По данным на 1 декабря 2025 года, именно столько населения в поселении, откуда я родом
• И получается, что мы с вами здесь собрали больше людей, чем живёт в месте, где я вырос
Если честно — это просто вау.
Очень сильное ощущение масштаба и ценности того, что происходит.
Отдельно хочу отметить, что результат был достигнут:💡
• без рекламы
• только взаимный пиар, комментарии и контент
Для меня это показатель, что формат и темы действительно вам откликаются.
Что дальше?☺️
Хочется развивать канал и делать его ещё полезнее, поэтому очень важно ваше мнение.
Что бы вы хотели видеть больше:🔨
• больше SQL / Python / аналитики
• больше разборов задач и собесов
• больше life-контента
• или есть другие идеи — пишите, всё читаю
Ну и, конечно, поздравляю вас с наступающим Новым годом 🎄
Спасибо, что читаете, комментируете и поддерживаете — это реально мотивирует продолжать.
🍆 Принимаю поздравления в комментариях — считаю, что результат действительно хороший.
❤️ Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.
Провожу консультации (подробности здесь):
🚬 Вопросы, обучение, консультации
@dima_sqlit
Хочу подвести итоги года и просто сказать спасибо.
Канал я начал активно вести с начала июля этого года.
Цель была максимально простая и понятная — набрать 1000 подписчиков до конца года.
И мы с вами эту цель перевыполнили.
Почему вы не видели постов про 500 или 1000 подписчиков?
Я сознательно их пропускал и ждал одно конкретное число.
📊 1106 человек. Почему именно оно для меня важно:
• По данным на 1 декабря 2025 года, именно столько населения в поселении, откуда я родом
• И получается, что мы с вами здесь собрали больше людей, чем живёт в месте, где я вырос
Если честно — это просто вау.
Очень сильное ощущение масштаба и ценности того, что происходит.
Отдельно хочу отметить, что результат был достигнут:
• без рекламы
• только взаимный пиар, комментарии и контент
Для меня это показатель, что формат и темы действительно вам откликаются.
Что дальше?
Хочется развивать канал и делать его ещё полезнее, поэтому очень важно ваше мнение.
Что бы вы хотели видеть больше:
• больше SQL / Python / аналитики
• больше разборов задач и собесов
• больше life-контента
• или есть другие идеи — пишите, всё читаю
Ну и, конечно, поздравляю вас с наступающим Новым годом 🎄
Спасибо, что читаете, комментируете и поддерживаете — это реально мотивирует продолжать.
Провожу консультации (подробности здесь):
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥39❤🔥15🐳8 3 3
Мало кто понимает, что OR — ленивый оператор, который проверяет условия слева направо и останавливается на первом истинном.
Звучит как оптимизация, но может сыграть злую шутку, если этого не знать.
Как работает ленивое вычисление?
Когда Python или SQL видит OR, он работает так:
• Проверяет первое условие слева
• Если оно истинно — возвращает результат и останавливается
• Если ложно — идёт проверять второе условие
Простыми словами: как только нашёл хоть одну правду — всё, дальше не смотрит. Это экономит ресурсы, но может пропустить важную логику.
Пример проблемы в Python:
Представим: мы проверяем пользователя — есть ли у него права админа или он прошёл дополнительную проверку безопасности.
def is_admin(user):
print("Проверяем права админа")
return user == 'admin'
def security_check(user):
print("Запускаем проверку безопасности")
# Тут могла быть запись в лог, отправка в аналитику и т.д.
return True
# Проверяем пользователя
user = 'admin'
access = is_admin(user) or security_check(user)
print(f"Доступ: {access}")
Вывод:
Проверяем права админа
Доступ: True
Проблема: Функция security_check() вообще не запустилась. Python увидел, что is_admin() вернул True, и дальше не пошёл. А там могла быть важная логика — запись в лог, отправка метрики, валидация. Всё это пропустилось из-за особенности работы оператора OR.
Пример проблемы в SQL:
Представим таблицу users с миллионом записей. Хотим найти пользователей, которые либо из Москвы, либо потратили больше 100 тысяч рублей.
SELECT
user_id,
city,
total_spent
FROM users
WHERE
1=1
AND (calculate_total_spent(user_id) > 100000 -- Тяжёлая функция
OR city = 'Moscow');
Проблема: Функция calculate_total_spent() очень дорогая — считает сумму по всем заказам пользователя. Если поставить её первой, она будет вычисляться для каждой строки. А если бы мы поставили city = 'Moscow' первым — для москвичей функция могла бы не считаться.
Важно: В SQL такая логика оператора OR не гарантирована стандартом. PostgreSQL и другие СУБД могут переставить условия или выполнить их параллельно. Оптимизатор сам решает, в каком порядке проверять.
Итог:
Оператор OR останавливается на первом истинном условии. В Python это гарантировано и работает всегда. В SQL — не гарантировано, оптимизатор может переставить условия.
Обучаю АНАЛитике и Провожу консультации (подробности здесь):
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🐳3❤🔥2
Слышал от многих, что на hh.ru нужно отправлять по 50+ откликов в день и даже скрипты для этого пишут.
Но давайте честно: массовые отклики — это ,большая потеря энергии. Лучше точечно находить компании, где действительно хочется работать.
Разберёмся пошагово, как это делать правильно.
Возьмите ручку и листок (или заметки в телефоне — не важно) и напишите, что для вас критично:
• Выдача техники (MacBook, монитор)
• Наличие IT-аккредитации у компании
• Конкретные технологии: SQL, Python, Superset, Redash, А/Б-тесты
• Полная удалёнка или гибрид
• ДМС и другие плюшки
Большинство ищет просто «аналитик данных» — и получает сотни нерелевантных вакансий.
А можно искать точечно, используя логические операторы прямо в строке поиска hh.ru.
Пример запроса:
Python AND Superset
Вернёт только те вакансии, где упоминаются оба инструмента.
Ещё круче:
SQL AND Python AND (ДМС OR удалённо)
Найдёт вакансии, где обязательно есть SQL и Python, плюс либо ДМС, либо удалёнка.
Это работает как WHERE в SQL — комбинируйте условия под себя.
Нашли интересную вакансию — не отправляйте просто резюме.
Напишите короткое сопроводительное письмо:
• Приветствие
• Почему вам интересна эта вакансия (технологии, продукт, команда)
• Какой релевантный опыт у вас есть
• Контакты для связи
• И т.д.
Это займёт 10 минут, но выделит вас среди сотни откликов с пустым полем.
Даже крутое сопроводительное не спасёт, если резюме составлено плохо.
Обновляйте его регулярно — это поднимает его в поиске у работодателей.
Если нужна помощь с составлением резюме / сопроводительного — можете обратиться ко мне @catdem, помогу разобраться.
Полный список c чем я могу помочь — mentor.dima-sqlit.ru
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥20🔥16🐳10 2
Начнем сразу с ТОП 3 поста по реакциям:
Для тех кто вкатывается в IT (Аналитика данных), серия постов про бесплатные материалы:
ТОП 5 - Полезных постов по моему мнению:
@dima_sqlit
#winter #winter2025 #итогигода #итоги2025 #christmas #NY #newyear
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤🔥14 7
🔮 2026 год: чего ждать? Мой взгляд и ключевые тренды
Друзья, всем привет.
Первый пост в этом году решил написать о том, что реально будет важно в 2026 году.
Мы живём во времени, когда объём информации растёт экспоненциально.
И главный навык — уметь отфильтровывать важное от шума.
Раньше можно было:
• распыляться
• залипать в мемы
• учить всё подряд “понемногу”
Сейчас это становится слишком дорогой роскошью.
🤔 Почему фокус внимания — ключевой навык:
Раньше люди могли быть докторами наук сразу в нескольких областях.
Это было возможно, потому что объём знаний был ограничен.
Сегодня:
• каждая область перегружена информацией
• поверхностные знания почти ничего не стоят
• распыление = потеря времени и результата
2026 — это время точечного развития.
🧠 Когнитивные искажения — скрытый фактор 2026:
Когда информации становится слишком много, мозг начинает упрощать реальность, чтобы сэкономить энергию.
Он делает это неосознанно — через шаблоны и короткие пути мышления.
Эти систематические ошибки мышления и называются когнитивными искажениями.
Проще говоря:
👉 мозг не ищет истину, он ищет быстрое и удобное объяснение.
Почему это становится особенно важным в 2026:
• вокруг больше информации, чем мы способны переварить
• ИИ генерирует правдоподобные, но не всегда верные ответы
• маркетинг давит сильнее, чем факты
• решения нужно принимать быстрее
В такой среде именно когнитивные искажения:
• заставляют верить в хайп
• мешают учиться глубоко
• ломают фокус
• приводят к плохим карьерным и финансовым решениям
Примеры:
• эффект якорения — когда первое услышанное число/мнение сильно влияет на все последующие решения
• окно Овертона — когда через инфошум и многоразового повторения “нормализуют” то, что раньше казалось не мыслимым
• выученная беспомощность — когда человек перестаёт что-то менять (если предыдущий опыт был негативным), даже если может
Понимание этих механизмов напрямую влияет на:
• то, как вы учитесь
• какие решения принимаете
• кому и чему доверяете
• как зарабатываете деньги
Именно поэтому я планирую отдельную серию постов про когнитивные искажения — без заумных терминов, с примерами из работы и жизни.
🤖 Что по поводу ИИ (AI):
ИИ — полезный инструмент, но вокруг него сейчас не обосновано много "хайпа".
Что ИИ реально умеет:
• быстрее разобраться в теме
• быстрее сделать MVP / прототип
• быстрее написать код, SQL, аналитику
• быстрее накидать варианты решений
Если вы делаете серьёзный продукт, где важны:
• стабильность (чтобы не падал в проде)
• безопасность (доступы, уязвимости, данные)
• производительность (чтобы система быстро работала под нагрузкой)
• качество (минимум багов, поддерживаемость, тесты)
ИИ не сделает это за вас.
LLM — это модели, которые предсказывают ответ с определенной вероятностью, а не “думают”.
Без вашей проверки они легко ошибаются.
Маркетинга вокруг ИИ сейчас больше, чем реальной магии.
Используйте AI как ускоритель, а не как замену мышления.
💰 Почему ИИ хайпят из каждого утюга
Причина банальная — деньги.
• в ИИ влиты десятки миллиардов долларов
• инвесторам нужно показать рост и “будущее”
• рынку нужно верить, что «в этот раз всё точно окупится»
Поэтому:
• ИИ продают как магию
• сложности и ограничения замалчивают
• успехи масштабируют, провалы игнорируют
Это не заговор — это обычная экономика.
Итог:
🌟 Пересылайте друзьям и сохраняйте себе данный пост, чтобы не потерять.
❤️ Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
❓ Как вы видите 2026 год? Согласны ли с моими выводами?
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.
💎 Полный список c чем я могу помочь — mentor.dima-sqlit.ru
@dima_sqlit
Друзья, всем привет.
Первый пост в этом году решил написать о том, что реально будет важно в 2026 году.
Мы живём во времени, когда объём информации растёт экспоненциально.
И главный навык — уметь отфильтровывать важное от шума.
Раньше можно было:
• распыляться
• залипать в мемы
• учить всё подряд “понемногу”
Сейчас это становится слишком дорогой роскошью.
Раньше люди могли быть докторами наук сразу в нескольких областях.
Это было возможно, потому что объём знаний был ограничен.
Сегодня:
• каждая область перегружена информацией
• поверхностные знания почти ничего не стоят
• распыление = потеря времени и результата
2026 — это время точечного развития.
🧠 Когнитивные искажения — скрытый фактор 2026:
Когда информации становится слишком много, мозг начинает упрощать реальность, чтобы сэкономить энергию.
Он делает это неосознанно — через шаблоны и короткие пути мышления.
Эти систематические ошибки мышления и называются когнитивными искажениями.
Проще говоря:
👉 мозг не ищет истину, он ищет быстрое и удобное объяснение.
Почему это становится особенно важным в 2026:
• вокруг больше информации, чем мы способны переварить
• ИИ генерирует правдоподобные, но не всегда верные ответы
• маркетинг давит сильнее, чем факты
• решения нужно принимать быстрее
В такой среде именно когнитивные искажения:
• заставляют верить в хайп
• мешают учиться глубоко
• ломают фокус
• приводят к плохим карьерным и финансовым решениям
Примеры:
• эффект якорения — когда первое услышанное число/мнение сильно влияет на все последующие решения
• окно Овертона — когда через инфошум и многоразового повторения “нормализуют” то, что раньше казалось не мыслимым
• выученная беспомощность — когда человек перестаёт что-то менять (если предыдущий опыт был негативным), даже если может
Понимание этих механизмов напрямую влияет на:
• то, как вы учитесь
• какие решения принимаете
• кому и чему доверяете
• как зарабатываете деньги
Именно поэтому я планирую отдельную серию постов про когнитивные искажения — без заумных терминов, с примерами из работы и жизни.
🤖 Что по поводу ИИ (AI):
ИИ — полезный инструмент, но вокруг него сейчас не обосновано много "хайпа".
Что ИИ реально умеет:
• быстрее разобраться в теме
• быстрее сделать MVP / прототип
• быстрее написать код, SQL, аналитику
• быстрее накидать варианты решений
Если вы делаете серьёзный продукт, где важны:
• стабильность (чтобы не падал в проде)
• безопасность (доступы, уязвимости, данные)
• производительность (чтобы система быстро работала под нагрузкой)
• качество (минимум багов, поддерживаемость, тесты)
ИИ не сделает это за вас.
LLM — это модели, которые предсказывают ответ с определенной вероятностью, а не “думают”.
Без вашей проверки они легко ошибаются.
Маркетинга вокруг ИИ сейчас больше, чем реальной магии.
Используйте AI как ускоритель, а не как замену мышления.
💰 Почему ИИ хайпят из каждого утюга
Причина банальная — деньги.
• в ИИ влиты десятки миллиардов долларов
• инвесторам нужно показать рост и “будущее”
• рынку нужно верить, что «в этот раз всё точно окупится»
Поэтому:
• ИИ продают как магию
• сложности и ограничения замалчивают
• успехи масштабируют, провалы игнорируют
Это не заговор — это обычная экономика.
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥16🔥13 5 2 1 1
Друзья, всем привет.
Есть реальная возможность потестить Gemini 3 PRO в Business-версии абсолютно бесплатно на 30 дней — благодаря акции от Google.
Пошаговый план доступа:
1) Переходим по ссылке с акцией
2) Используем временную почту (если не хотим использовать свою), для этого я использовал вот этот сервис
3) Берем почту из пункта 2 и вводим ее на странице с акцией из пункта 1, далее вам придет на почту код верификации, вы его вводите и получаете доступ, все очень просто)
Какие проблемы могут быть:
• Из-за того, что это бесплатно и просто получить на эту подписку особо большая нагрузка, по этой причине ваши запросы могут долго висеть в очереди (я пробовал вчера ночью, все достаточно шустро работало)
• В любой момент подписка может быть деактивирована, так как это бесплатно, но я думаю это не беда, наше дело попробовать
• Если аккаунт будет сделан на основе временной почты, то скорее всего через 1-2 дня вас попросит пере зайти в аккаунт и вы уже не сможете в него войти, так как у вас не будет доступа к почте с которой вы регистрировали аккаунт
Итог:
@dima_sqlit
#gemini #ai #sql #python #dataanalytics #dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤🔥7🔥5🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Привет! В прошлых частях я рассказал про БАДы и про Менталку, на очереди спорт.
Прошлые части:
1) Про БАДы
2) Про Менталку
Начну с того, что я считаю, что все что мы делаем должно быть в кайф и должно иметь баланс, как в работе, как в отношениях, так и в спорте. По этой причине в плане спорта я нашел для себя упражнения, которые мне очень нравятся, которые можно выполнят почти везде и инвентарь для этого либо не нужен либо он минимальный, вот упражнения которые я очень люблю и стараюсь выполнять.
Мой топ 6 упражнений:
🔥Вот короткое видео с моими подтягиваниями вживую (смотрим прикрепленное видео).
Создал отдельный канал @dima_not_sqlit там будет life-контент:
Уже сейчас загрузил туда несколько видео где я занимаюсь спортом, заходим, ставим лайки, подписываемся, комментируем)
Итог:
Это база для меня, но мы все разные — ищите свои упражнения, чтобы шло в кайф. Пробуйте, экспериментируйте!
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤🔥12🐳7
Друзья, всем привет. Сегодня поговорим про два термина, которые звучат страшно, но на деле — это база для любого, кто пишет скрипты, DAG'и или собирает витрины данных.
Аналитики сейчас часто не только строят графики, но и сами настраивают сбор данных (например, в Airflow). И тут важно понимать два принципа, чтобы не получить дубли или кривые цифры в отчетах.
Звучит сложно, а суть простая:
Если мы скармливаем функции одни и те же данные на вход, она всегда должна возвращать один и тот же результат.
Детерминированный пример в SQL:
LOWER('Dima') — всегда вернет 'dima'
Это детерминировано.
Не детерминированный пример в SQL:
• NOW() или RANDOM() — каждый раз вернут разное значение, даже если вы ничего не меняли.
Почему это важно нам? Когда вы пишете расчет метрики, вы должны быть уверены: если вы запустите расчет сегодня, завтра или через год на тех же самых исходных данных — значения должны получиться одинаковые.
Это про то, что количество запусков скрипта не должно ломать данные.
Представьте ситуацию: Вы написали скрипт для DAG'а, который считает продажи за вчерашний день и кладет их в итоговую таблицу. Если скрипт упал на середине или вы случайно запустили его два раза подряд — что произойдет?
❌ Плохой сценарий (Не идемпотентно): Скрипт просто берет и вставляет данные (INSERT). Запустили два раза — данные задвоились. Отчет показывает выручку x2.
✅ Хороший сценарий (Идемпотентно): Скрипт написан так, что сколько его ни запускай, результат будет корректный.
Как это делается (Логика, которую нужно прописывать): Перед тем как загрузить данные за конкретную дату (например, за 15 января), мы сначала должны «почистить» место.
Алгоритм простой:
Сначала удаляем данные за эту дату:
DELETE FROM table WHERE date = '2026-01-15'
И только потом вставляем новые данные:
INSERT INTO table ...
Теперь, даже если вы перезапустите DAG 10 раз подряд, у вас не будет дублей. Скрипт сначала удалит старое, а потом запишет новое. В таблице всегда будут актуальные данные в единственном экземпляре.
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤🔥5 4 2
Друзья, всем привет. Многие, слышали понятие Асинхронность и думали: «Ну, это какая-то сложная идея, пожалуй обойду ее стороной»
На самом деле, вы используете принцип асинхронности каждый день в обычной жизни, даже не замечая этого. И понять его проще, чем кажется.
Представьте, что вы решили сварить суп. Вы поставили кастрюлю с водой на плиту. Вода закипит только через 10 минут.
Два варианта ваших действий:
❌ Синхронный подход (По очереди): Вы встаете напротив плиты и 10 минут пристально смотрите на воду. Вы не отвечаете на сообщения, не режете овощи, не листаете ленту. Вы полностью заблокированы ожиданием кипятка. Глупо? Глупо.
✅ Асинхронный подход (Эффективный): Пока вода греется, вы не ждете, а переключаетесь: чистите картошку, отвечаете в рабочем чате или читаете книгу. Как только вода закипела, вы возвращаетесь к кастрюле и закидываете мясо.
Суть простая: Вы не ждете завершения долгого процесса (нагрев воды), чтобы начать делать что-то другое. Это и есть асинхронность.
В программировании это работает точно так же. Представьте, что ваш скрипт или сайт — это кассир в магазине.
❌ Без асинхронности: Подходит покупатель и говорит: «Мне нужно узнать баланс карты» (это запрос в Базу Данных). База данных думает 5 секунд. В этом сценарии кассир просто замирает и ждет. Вся очередь за этим покупателем стоит. Сайт «висит», никто ничего не может купить, все злятся.
✅ С асинхронностью: Покупатель просит баланс. Кассир отправляет запрос в БД и, не дожидаясь ответа, сразу начинает обслуживать следующего человека! Он как бы говорит: «Я отправил запрос, пока ждем ответ — следующий!». Как только база данных "ответила", кассир на секунду возвращается к первому покупателю и говорит результат.
Один кассир успевает обслуживать сотни людей, просто эффективно используя время, пока система "думает".
🧠 Как применять это в жизни?
Этот принцип — отличный лайфхак для личной продуктивности. Мы часто теряем время в режимах пассивного ожидания (пока выгружается отчет, пока едет такси).
Как стать асинхронным:
• Запустили тяжелый SQL-запрос на 15 минут? Не сидите и не смотрите, как бежит полоска загрузки. Переключайтесь на мелкие задачи (ответить на почту, навести порядок в папках и т.д.).
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥10🐳6🔥4 3
Как пройти секцию по АБ тестам на собеседовании?
Далеко не каждый опытный аналитик сталкивался с АБ тестами, а новички боятся утонуть во всей этой статистике. У многих вызывают трудности такие вопросы:
- P-value, альфа, ошибка первого рода - это все одно и тоже?
- Как выбрать стат критерий?
- Почему за АБ тестами нельзя "подглядывать"?
- АА тест показал стат значимые отличия. Это норма?
Ответы на эти вопросы вы можете найти в канале Юрия Борзило, там уже собрано более 60 постов с разбором разных нюансов АБ тестирования, а также много постов о продуктовой аналитике. Если у вас есть сложности с АБ тестами, то в канале вы найдете много полезных материалов.
Реклама: Борзило Ю.А., erid:2VtzquWVWmZ, ИНН: 026702638983
Далеко не каждый опытный аналитик сталкивался с АБ тестами, а новички боятся утонуть во всей этой статистике. У многих вызывают трудности такие вопросы:
- P-value, альфа, ошибка первого рода - это все одно и тоже?
- Как выбрать стат критерий?
- Почему за АБ тестами нельзя "подглядывать"?
- АА тест показал стат значимые отличия. Это норма?
Ответы на эти вопросы вы можете найти в канале Юрия Борзило, там уже собрано более 60 постов с разбором разных нюансов АБ тестирования, а также много постов о продуктовой аналитике. Если у вас есть сложности с АБ тестами, то в канале вы найдете много полезных материалов.
Реклама: Борзило Ю.А., erid:2VtzquWVWmZ, ИНН: 026702638983
🔥14 11🐳7❤🔥2 1
🐍 Бесплатно изучаем ООП на Python: нужно ли это аналитику?
Слышал много споров на тему: «Нужно ли аналитику знать ООП (Объектно-Ориентированное Программирование) или можно обойтись без него?».
У меня эта тема давно висела в списке «хочу изучить», но руки не доходили. Я начинал проходить много курсов, но они мне не заходили: либо материал подавали слишком сложно, либо формат объяснения был скучным и непонятным.
🤨 Что я нашел:
Совсем недавно наткнулся на автора на Stepik, у которого куча бесплатных курсов с огромным количеством положительных отзывов. Решил попробовать и не пожалел.
Курсы по ООП (там две части) мне сильно понравились. Да, безусловно, там покрывается не 100% всех тонкостей ООП, но для бесплатных материалов — это одни из лучших курсов. Для базового понимания парадигмы — то, что нужно.
🤩 Важный нюанс:
Если вы не знаете базового Python, вам будет сложновато. Поэтому новичкам рекомендую сначала пройти базу. Я всегда и всем советую курсы «Поколение Python» (для начинающих и продвинутых) — это золотой стандарт.
🚬 Мой лайфхак:
Я зарегистрировался сразу на все бесплатные курсы этого автора. Почему стоит сделать так же? В перспективе курсы могут обновиться, улучшиться и стать платными. А если вы уже записаны — доступ останется у вас бесплатно.
Ссылки на курсы:
• ООП Часть 1
• ООП Часть 2
• Все курсы автора
Итог:🤩
🍸 Сохраняйте пост, чтобы не потерять ссылки на курсы.
❓ А как у вас отношения с ООП? Изучали или считаете лишним? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.
🚬 Готовлю вас к собесам и пишу резюме здесь: mentor.dima-sqlit.ru
@dima_sqlit
Слышал много споров на тему: «Нужно ли аналитику знать ООП (Объектно-Ориентированное Программирование) или можно обойтись без него?».
У меня эта тема давно висела в списке «хочу изучить», но руки не доходили. Я начинал проходить много курсов, но они мне не заходили: либо материал подавали слишком сложно, либо формат объяснения был скучным и непонятным.
Совсем недавно наткнулся на автора на Stepik, у которого куча бесплатных курсов с огромным количеством положительных отзывов. Решил попробовать и не пожалел.
Курсы по ООП (там две части) мне сильно понравились. Да, безусловно, там покрывается не 100% всех тонкостей ООП, но для бесплатных материалов — это одни из лучших курсов. Для базового понимания парадигмы — то, что нужно.
Если вы не знаете базового Python, вам будет сложновато. Поэтому новичкам рекомендую сначала пройти базу. Я всегда и всем советую курсы «Поколение Python» (для начинающих и продвинутых) — это золотой стандарт.
Я зарегистрировался сразу на все бесплатные курсы этого автора. Почему стоит сделать так же? В перспективе курсы могут обновиться, улучшиться и стать платными. А если вы уже записаны — доступ останется у вас бесплатно.
Ссылки на курсы:
• ООП Часть 1
• ООП Часть 2
• Все курсы автора
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤🔥6🐳3
Отличная возможность ворваться в аналитику уже в 2026 году
Ребята, у меня для вас есть супер крутое сообщение:
Если вы давно поглядываете в сторону аналитики, но всё откладываете первый шаг — кажется, этот момент настал.
Курс-симулятор «Аналитик данных» от Simulative
Что внутри:
Кому подойдет данный курс:
1. Тем, кто хочет войти в аналитику с нуля
2. Тем, кто уже в цифрах, но чувствует, что нужно заапгрейдить знания
3. Тем, кто изучал другие материалы, но в голове каша и не понимание, что делать дальше
Самое важное: у Simulative сейчас — скидка 35%!
🔗 Скорее записывайтесь на курс со скидкой: simulative.ru/data-analyst
Ребята, у меня для вас есть супер крутое сообщение:
Если вы давно поглядываете в сторону аналитики, но всё откладываете первый шаг — кажется, этот момент настал.
Курс-симулятор «Аналитик данных» от Simulative
Что внутри:
➖ 12 модулей с нормальной, системной базой: SQL, Python, BI, статистика, продуктовые метрики➖ Практика на реальных кейсах, чтобы в итоге было не «я что-то смотрел», а портфолио➖ Формат без истерики и гонки: видео, тексты, конспекты, домашки — учишься в своём темпе➖ Наставники, которые реально проверяют и помогают, а не просто висят для галочки➖ Возможность получить оффер сразу после курса
Кому подойдет данный курс:
1. Тем, кто хочет войти в аналитику с нуля
2. Тем, кто уже в цифрах, но чувствует, что нужно заапгрейдить знания
3. Тем, кто изучал другие материалы, но в голове каша и не понимание, что делать дальше
Самое важное: у Simulative сейчас — скидка 35%!
🔗 Скорее записывайтесь на курс со скидкой: simulative.ru/data-analyst
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥12🔥9 7 1
Увидел в соседнем канале разбор задач с собеседования в Магнит OMNI и одна задачка была не разобрана и она показалось мне очень интересной — решил разобрать ее здесь, думаю многим будет полезно.
Условия задачи (это секция на языке Python):
• Представим что вы пришли в кинотеатр зал которого состоит только из одного ряда.
• Вы хотите сидеть максимально далеко от других зрителей
• Напишите функцию которая принимает на вход список мест в виде 0/1 и возвращает расстояние от оптимального места до ближайшего соседа
• Гарантируется что есть свободные места и хотя бы один зритель
Пример того, как должна работать итоговая функция:
func([1, 0, 1]) == 0
func([1, 0, 0, 0, 0, 1]) == 1
func([1, 0, 0, 0, 0, 1, 0, 0, 0, 0]) == 3
func([0, 0, 0, 0, 0, 1, 0, 0, 0, 1]) == 4
Разбор задачи по шагам:
Я сразу покажу вам решение, чтобы мы его разобрали.
def func(seats):
occupied = [i for i, seat in enumerate(seats) if seat == 1]
best = []
for i, seat in enumerate(seats):
if seat == 0:
dist = min(abs(i - j) - 1 for j in occupied)
best.append(dist)
return max(best)
Давайте разбираться, что здесь происходит:
1) Сначала проходимся по списку и находим места, которые заняты:
occupied = [i for i, seat in enumerate(seats) if seat == 1]
То есть мы проверяем, если значение равно 1, то это место занято и мы сохраним индекс этого места в списке
2) Далее посмотрим все не занятые места и найдем для каждого из них минимальное расстояние до занятого места и вычтем единицу и будем добавлять эти расстояния в список:
for i, seat in enumerate(seats):
if seat == 0:
dist = min(abs(i - j) - 1 for j in occupied)
best.append(dist)
3) Отлично, теперь остается взять наибольшее значение из списка и получить ответ:
return max(best)
Итог:
@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳8❤🔥6 5🔥2