Дима SQL-ит 🧑‍💻 (Аналитика данных)
1.29K subscribers
18 photos
2 videos
64 links
👨‍💻 Блог аналитика данных в IT

📩 По менторству и сотрудничеству: @catdem
Download Telegram
👨‍💻 Подведу итоги канала при помощи сервиса, как многие это делают, а я не отстают от тренда)

Начнем сразу с ТОП 3 поста по реакциям:
1️⃣Итоги года и большое спасибо вам
2️⃣ Как посчитать медиану в SQL — разберем задачу с собеседования
3️⃣ Казалось бы, агрегатные функции в SQL (SUM, AVG, COUNT) просто считают значения — что тут сложного? Но есть скрытая ловушка: как они ведут себя с NULL?

Для тех кто вкатывается в IT (Аналитика данных), серия постов про бесплатные материалы:
1️⃣Бесплатные материалы для изучения статистики и проведения A/B тестов
2️⃣Бесплатные материалы для изучения визуализации данных
3️⃣Бесплатные материалы для изучения SQL — от азов до продвинутых тем
4️⃣Бесплатные материалы для изучения Python — базовый минимум для аналитики

ТОП 5 - Полезных постов по моему мнению:
1️⃣Повышаем продуктивность в Jupyter Notebook - мой личный топ горячих клавиш
2️⃣Как забирать данные из Google Sheets по API через Python
3️⃣ Копируем данные из DataFrame к себе в буфер обмена без лишних шагов с сохранением файлов
4️⃣ Как за 400 рублей в год получить доступ к Claude, ChatGPT, Gemini и Grok через Perplexity и без использования VPN
5️⃣ Как эффективно искать работу на HeadHunter — без массовых откликов и скриптов

☺️ Коротенькие итоги этого года:
🟠Спасибо, что остаетесь и подписывайтесь на канал, в следующем году постараюсь, делать как минимум не хуже, чем в этом (буду ждать от вас комментарии, что можно улучшить и чего по вашему мнению не хватает в блоге).
🟠В частности есть мысль, чтобы создать второй канал под life контент (спорт, покупки и т.п.). Хочется услышать ваше мнение (спойлер канал уже создан, но пока не знаю стоит ли делать под это отдельный канал, по моим ощущениям - стоит)
🟠В этом году открыл для себя направления менторства, всегда нравилось обучать кого-то и объяснять "сложное" простыми словами и при этом я тоже сам учусь
🟠Сделал интересные покупки в этом году, собираюсь это осветить чуть позже в канале (в этом или новом)
🟠Взял за практику стараться раз 1-1.5 месяца менять обстановку
🟠И т.д.

А что вы поняли и сделали за этого год и что собираетесь осуществить в следующем ?

@dima_sqlit

#winter #winter2025 #итогигода #итоги2025 #christmas #NY #newyear
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤‍🔥147
🔮 2026 год: чего ждать? Мой взгляд и ключевые тренды

Друзья, всем привет.
Первый пост в этом году решил написать о том, что реально будет важно в 2026 году.

Мы живём во времени, когда объём информации растёт экспоненциально.
И главный навык — уметь отфильтровывать важное от шума.

Раньше можно было:
• распыляться
• залипать в мемы
• учить всё подряд “понемногу”

Сейчас это становится слишком дорогой роскошью.

🤔 Почему фокус внимания — ключевой навык:
Раньше люди могли быть докторами наук сразу в нескольких областях.
Это было возможно, потому что объём знаний был ограничен.

Сегодня:
• каждая область перегружена информацией
• поверхностные знания почти ничего не стоят
• распыление = потеря времени и результата

2026 — это время точечного развития.

🧠 Когнитивные искажения — скрытый фактор 2026:

Когда информации становится слишком много, мозг начинает упрощать реальность, чтобы сэкономить энергию.
Он делает это неосознанно — через шаблоны и короткие пути мышления.

Эти систематические ошибки мышления и называются когнитивными искажениями.

Проще говоря:
👉 мозг не ищет истину, он ищет быстрое и удобное объяснение.

Почему это становится особенно важным в 2026:
• вокруг больше информации, чем мы способны переварить
• ИИ генерирует правдоподобные, но не всегда верные ответы
• маркетинг давит сильнее, чем факты
• решения нужно принимать быстрее

В такой среде именно когнитивные искажения:
• заставляют верить в хайп
• мешают учиться глубоко
• ломают фокус
• приводят к плохим карьерным и финансовым решениям

Примеры:
• эффект якорения — когда первое услышанное число/мнение сильно влияет на все последующие решения
• окно Овертона — когда через инфошум и многоразового повторения “нормализуют” то, что раньше казалось не мыслимым
• выученная беспомощность — когда человек перестаёт что-то менять (если предыдущий опыт был негативным), даже если может

Понимание этих механизмов напрямую влияет на:
• то, как вы учитесь
• какие решения принимаете
• кому и чему доверяете
• как зарабатываете деньги

Именно поэтому я планирую отдельную серию постов про когнитивные искажения — без заумных терминов, с примерами из работы и жизни.

🤖 Что по поводу ИИ (AI):
ИИ — полезный инструмент, но вокруг него сейчас не обосновано много "хайпа".

Что ИИ реально умеет:
• быстрее разобраться в теме
• быстрее сделать MVP / прототип
• быстрее написать код, SQL, аналитику
• быстрее накидать варианты решений

Если вы делаете серьёзный продукт, где важны:
• стабильность (чтобы не падал в проде)
• безопасность (доступы, уязвимости, данные)
• производительность (чтобы система быстро работала под нагрузкой)
• качество (минимум багов, поддерживаемость, тесты)

ИИ не сделает это за вас.

LLM — это модели, которые предсказывают ответ с определенной вероятностью, а не “думают”.
Без вашей проверки они легко ошибаются.

Маркетинга вокруг ИИ сейчас больше, чем реальной магии.
Используйте AI как ускоритель, а не как замену мышления.

💰 Почему ИИ хайпят из каждого утюга

Причина банальная — деньги.

• в ИИ влиты десятки миллиардов долларов
• инвесторам нужно показать рост и “будущее”
• рынку нужно верить, что «в этот раз всё точно окупится»

Поэтому:
• ИИ продают как магию
• сложности и ограничения замалчивают
• успехи масштабируют, провалы игнорируют

Это не заговор — это обычная экономика.

Итог:

🌟 Пересылайте друзьям и сохраняйте себе данный пост, чтобы не потерять.
❤️Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
Как вы видите 2026 год? Согласны ли с моими выводами?
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

💎 Полный список c чем я могу помочь — mentor.dima-sqlit.ru

@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥16🔥135211
🪙 Получаем Gemini 3 PRO бесплатно:

Друзья, всем привет.
Есть реальная возможность потестить Gemini 3 PRO в Business-версии абсолютно бесплатно на 30 дней — благодаря акции от Google.

Пошаговый план доступа:
1) Переходим по ссылке с акцией
2) Используем временную почту (если не хотим использовать свою), для этого я использовал вот этот сервис
3) Берем почту из пункта 2 и вводим ее на странице с акцией из пункта 1, далее вам придет на почту код верификации, вы его вводите и получаете доступ, все очень просто)

Какие проблемы могут быть:
• Из-за того, что это бесплатно и просто получить на эту подписку особо большая нагрузка, по этой причине ваши запросы могут долго висеть в очереди (я пробовал вчера ночью, все достаточно шустро работало)
• В любой момент подписка может быть деактивирована, так как это бесплатно, но я думаю это не беда, наше дело попробовать
• Если аккаунт будет сделан на основе временной почты, то скорее всего через 1-2 дня вас попросит пере зайти в аккаунт и вы уже не сможете в него войти, так как у вас не будет доступа к почте с которой вы регистрировали аккаунт

Итог:

🌟 Пересылайте друзьям и сохраняйте пост — акция не вечная.
❤️Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
Пробовали Gemini 3 PRO? Как vs Claude/Grok/ChatGPT для SQL/Python/других задач? Делитесь!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

💎 Полный список c чем я могу помочь — mentor.dima-sqlit.ru

@dima_sqlit

#gemini #ai #sql #python #dataanalytics #dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥7🔥5🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 Здоровье в IT: как я поддерживаю свое физическое состояние. Часть 3 — про Спорт:

Привет! В прошлых частях я рассказал про БАДы и про Менталку, на очереди спорт.
Прошлые части:
1) Про БАДы
2) Про Менталку

Начну с того, что я считаю, что все что мы делаем должно быть в кайф и должно иметь баланс, как в работе, как в отношениях, так и в спорте. По этой причине в плане спорта я нашел для себя упражнения, которые мне очень нравятся, которые можно выполнят почти везде и инвентарь для этого либо не нужен либо он минимальный, вот упражнения которые я очень люблю и стараюсь выполнять.

Мой топ 6 упражнений:
1️⃣ Подтягивания — одно из самых доступных и суперполезных упражнений. Задействует спину, руки, пресс и кучу неочевидных мышц. Нужен только турник: имеется почти на каждой спортивной площадке, или покупается на маркетплейсе и ставится в проеме.
2️⃣ Приседания - тоже упражнение очень полезное, разгоняет кровь, профилактика простаты (мы люди уже взрослые работаем про активно) и в целом помогает чувствовать себя в тонусе, особенно когда часто сидишь за компьютером. Делаю обычно по ощущениям, подходов 4-5, а повторений 10-30
3️⃣ Резина - чудо чудесное, беру с собой в поездки средней жесткости и поддерживать форму очень удобно. В новогодние праздники брал такую вещь с собой, не занимает много места, а упражнений можно придумать уйма, это и работа на бицепс, это и тренировка плеч, кисти и т.п. Считаю мастхев инструмент, который окупиться почти сразу же.
4️⃣ Отжимания - Ну здесь база, инвентарь это любой пол, подходит для любого человека, будь то новичок или уже на опыте, можно начать с отжимания с колен. Тоже работает большое количество мышц, то что нужно.
5️⃣ Работа с железом - здесь люблю тоже делать базу, это поднимание гантелей на бицепс. Жим от груди. Становую не делаю и приседание со штангой тоже, считаю, что обычных приседаний мне на данный момент более чем достаточно, а если хочу утяжелить приседания, то беру в руки гантели и приседаю с ними.
6️⃣ Прогулки - люблю гулять, узнавать новые локации в городе и в целом стараюсь делать базу 10000 шагов в день. Кстати, это одна из причин, чтобы заставить себя сходить в офис)

🔥Вот короткое видео с моими подтягиваниями вживую (смотрим прикрепленное видео).
Создал отдельный канал @dima_not_sqlit там будет life-контент:
Уже сейчас загрузил туда несколько видео где я занимаюсь спортом, заходим, ставим лайки, подписываемся, комментируем)

Итог: 🤩
Это база для меня, но мы все разные — ищите свои упражнения, чтобы шло в кайф. Пробуйте, экспериментируйте!

🍸 Если вы нашли пост для себя полезным, то накидывайте реакций, чтобы я понимал, что вам эта тема интересна!
❤️ Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
А как вы поддерживаете свое физическое здоровье? Занимаетесь спортом, гуляете или есть что-то еще....? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

🚬 Полный список c чем я могу помочь — mentor.dima-sqlit.ru


@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤‍🔥12🐳7
😅 Идемпотентность и Детерминированность: что это и почему аналитику важно это знать:

Друзья, всем привет. Сегодня поговорим про два термина, которые звучат страшно, но на деле — это база для любого, кто пишет скрипты, DAG'и или собирает витрины данных.

Аналитики сейчас часто не только строят графики, но и сами настраивают сбор данных (например, в Airflow). И тут важно понимать два принципа, чтобы не получить дубли или кривые цифры в отчетах.

🔜 Детерминированность (Determinism):
Звучит сложно, а суть простая:
Если мы скармливаем функции одни и те же данные на вход, она всегда должна возвращать один и тот же результат.

Детерминированный пример в SQL:
LOWER('Dima') — всегда вернет 'dima'
Это детерминировано.


Не детерминированный пример в SQL:
• NOW() или RANDOM() — каждый раз вернут разное значение, даже если вы ничего не меняли.


Почему это важно нам? Когда вы пишете расчет метрики, вы должны быть уверены: если вы запустите расчет сегодня, завтра или через год на тех же самых исходных данных — значения должны получиться одинаковые.

🔜 Идемпотентность (Idempotency):
Это про то, что количество запусков скрипта не должно ломать данные.

Представьте ситуацию: Вы написали скрипт для DAG'а, который считает продажи за вчерашний день и кладет их в итоговую таблицу. Если скрипт упал на середине или вы случайно запустили его два раза подряд — что произойдет?

Плохой сценарий (Не идемпотентно): Скрипт просто берет и вставляет данные (INSERT). Запустили два раза — данные задвоились. Отчет показывает выручку x2.

Хороший сценарий (Идемпотентно): Скрипт написан так, что сколько его ни запускай, результат будет корректный.


Как это делается (Логика, которую нужно прописывать): Перед тем как загрузить данные за конкретную дату (например, за 15 января), мы сначала должны «почистить» место.

Алгоритм простой:
Сначала удаляем данные за эту дату:
DELETE FROM table WHERE date = '2026-01-15'

И только потом вставляем новые данные:
INSERT INTO table ...


Теперь, даже если вы перезапустите DAG 10 раз подряд, у вас не будет дублей. Скрипт сначала удалит старое, а потом запишет новое. В таблице всегда будут актуальные данные в единственном экземпляре.

Итог: 🤩

🍸 Сохраняйте пост, чтобы не путаться в терминах и грамотно писать код.
❤️ Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
Слышали об этих свойствах? Спрашивали у вас такое на собеседованиях? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

🚬 Менторство, консультации и подготовка к собесам — подробнее тут: mentor.dima-sqlit.ru


@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤‍🔥542
😉 Что такое Асинхронность? Разбираемся на простых примерах:

Друзья, всем привет. Многие, слышали понятие Асинхронность и думали: «Ну, это какая-то сложная идея, пожалуй обойду ее стороной»

На самом деле, вы используете принцип асинхронности каждый день в обычной жизни, даже не замечая этого. И понять его проще, чем кажется.

🤩 Пример из жизни:

Представьте, что вы решили сварить суп. Вы поставили кастрюлю с водой на плиту. Вода закипит только через 10 минут.

Два варианта ваших действий:

Синхронный подход (По очереди): Вы встаете напротив плиты и 10 минут пристально смотрите на воду. Вы не отвечаете на сообщения, не режете овощи, не листаете ленту. Вы полностью заблокированы ожиданием кипятка. Глупо? Глупо.

Асинхронный подход (Эффективный): Пока вода греется, вы не ждете, а переключаетесь: чистите картошку, отвечаете в рабочем чате или читаете книгу. Как только вода закипела, вы возвращаетесь к кастрюле и закидываете мясо.

Суть простая: Вы не ждете завершения долгого процесса (нагрев воды), чтобы начать делать что-то другое. Это и есть асинхронность.

📞 Как это работает в IT и Аналитике?

В программировании это работает точно так же. Представьте, что ваш скрипт или сайт — это кассир в магазине.

Без асинхронности: Подходит покупатель и говорит: «Мне нужно узнать баланс карты» (это запрос в Базу Данных). База данных думает 5 секунд. В этом сценарии кассир просто замирает и ждет. Вся очередь за этим покупателем стоит. Сайт «висит», никто ничего не может купить, все злятся.

С асинхронностью: Покупатель просит баланс. Кассир отправляет запрос в БД и, не дожидаясь ответа, сразу начинает обслуживать следующего человека! Он как бы говорит: «Я отправил запрос, пока ждем ответ — следующий!». Как только база данных "ответила", кассир на секунду возвращается к первому покупателю и говорит результат.

Один кассир успевает обслуживать сотни людей, просто эффективно используя время, пока система "думает".

🧠 Как применять это в жизни?

Этот принцип — отличный лайфхак для личной продуктивности. Мы часто теряем время в режимах пассивного ожидания (пока выгружается отчет, пока едет такси).

Как стать асинхронным:
• Запустили тяжелый SQL-запрос на 15 минут? Не сидите и не смотрите, как бежит полоска загрузки. Переключайтесь на мелкие задачи (ответить на почту, навести порядок в папках и т.д.).

Итог: 🤩

🍸 Сохраняйте пост, пригодится для общего понимания.
❤️ Поддержать канал бустами, чтобы у автора появился дополнительный функционал можно - здесь (это бесплатно и доступно с подпиской telegram premium)
А как вы используете асинхронность? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

🚬 Менторство, консультации и подготовка к собесам — подробнее тут: mentor.dima-sqlit.ru


@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥10🐳6🔥43
Как пройти секцию по АБ тестам на собеседовании?

Далеко не каждый опытный аналитик сталкивался с АБ тестами, а новички боятся утонуть во всей этой статистике. У многих вызывают трудности такие вопросы:

- P-value, альфа, ошибка первого рода - это все одно и тоже?
- Как выбрать стат критерий?
- Почему за АБ тестами нельзя "подглядывать"?
- АА тест показал стат значимые отличия. Это норма?

Ответы на эти вопросы вы можете найти в канале Юрия Борзило, там уже собрано более 60 постов с разбором разных нюансов АБ тестирования, а также много постов о продуктовой аналитике. Если у вас есть сложности с АБ тестами, то в канале вы найдете много полезных материалов.

Реклама: Борзило Ю.А., erid:2VtzquWVWmZ, ИНН: 026702638983
🔥1411🐳7❤‍🔥21
🐍 Бесплатно изучаем ООП на Python: нужно ли это аналитику?

Слышал много споров на тему: «Нужно ли аналитику знать ООП (Объектно-Ориентированное Программирование) или можно обойтись без него?».

У меня эта тема давно висела в списке «хочу изучить», но руки не доходили. Я начинал проходить много курсов, но они мне не заходили: либо материал подавали слишком сложно, либо формат объяснения был скучным и непонятным.

🤨 Что я нашел:

Совсем недавно наткнулся на автора на Stepik, у которого куча бесплатных курсов с огромным количеством положительных отзывов. Решил попробовать и не пожалел.
Курсы по ООП (там две части) мне сильно понравились. Да, безусловно, там покрывается не 100% всех тонкостей ООП, но для бесплатных материалов — это одни из лучших курсов. Для базового понимания парадигмы — то, что нужно.

🤩 Важный нюанс:

Если вы не знаете базового Python, вам будет сложновато. Поэтому новичкам рекомендую сначала пройти базу. Я всегда и всем советую курсы «Поколение Python» (для начинающих и продвинутых) — это золотой стандарт.

🚬 Мой лайфхак:

Я зарегистрировался сразу на все бесплатные курсы этого автора. Почему стоит сделать так же? В перспективе курсы могут обновиться, улучшиться и стать платными. А если вы уже записаны — доступ останется у вас бесплатно.

Ссылки на курсы:
ООП Часть 1
ООП Часть 2
Все курсы автора

Итог: 🤩

🍸 Сохраняйте пост, чтобы не потерять ссылки на курсы.
А как у вас отношения с ООП? Изучали или считаете лишним? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

🚬 Готовлю вас к собесам и пишу резюме здесь: mentor.dima-sqlit.ru


@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤‍🔥6🐳3
Отличная возможность ворваться в аналитику уже в 2026 году

Ребята, у меня для вас есть супер крутое сообщение:
Если вы давно поглядываете в сторону аналитики, но всё откладываете первый шаг — кажется, этот момент настал.

Курс-симулятор «Аналитик данных» от Simulative

Что внутри:
12 модулей с нормальной, системной базой: SQL, Python, BI, статистика, продуктовые метрики
Практика на реальных кейсах, чтобы в итоге было не «я что-то смотрел», а портфолио
Формат без истерики и гонки: видео, тексты, конспекты, домашки — учишься в своём темпе
Наставники, которые реально проверяют и помогают, а не просто висят для галочки
Возможность получить оффер сразу после курса


Кому подойдет данный курс:
1. Тем, кто хочет войти в аналитику с нуля
2. Тем, кто уже в цифрах, но чувствует, что нужно заапгрейдить знания
3. Тем, кто изучал другие материалы, но в голове каша и не понимание, что делать дальше

Самое важное: у Simulative сейчас — скидка 35%!

🔗 Скорее записывайтесь на курс со скидкой: simulative.ru/data-analyst
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥12🔥971
🛒 Разбор задачи с собеседования Магнит OMNI:

Увидел в соседнем канале разбор задач с собеседования в Магнит OMNI и одна задачка была не разобрана и она показалось мне очень интересной — решил разобрать ее здесь, думаю многим будет полезно.

Условия задачи (это секция на языке Python):

• Представим что вы пришли в кинотеатр зал которого состоит только из одного ряда.
• Вы хотите сидеть максимально далеко от других зрителей
• Напишите функцию которая принимает на вход список мест в виде 0/1 и возвращает расстояние от оптимального места до ближайшего соседа
• Гарантируется что есть свободные места и хотя бы один зритель

Пример того, как должна работать итоговая функция:
func([1, 0, 1]) == 0
func([1, 0, 0, 0, 0, 1]) == 1
func([1, 0, 0, 0, 0, 1, 0, 0, 0, 0]) == 3
func([0, 0, 0, 0, 0, 1, 0, 0, 0, 1]) == 4


Разбор задачи по шагам:

Я сразу покажу вам решение, чтобы мы его разобрали.
def func(seats):
occupied = [i for i, seat in enumerate(seats) if seat == 1]
best = []

for i, seat in enumerate(seats):
if seat == 0:
dist = min(abs(i - j) - 1 for j in occupied)
best.append(dist)

return max(best)


Давайте разбираться, что здесь происходит:

1) Сначала проходимся по списку и находим места, которые заняты:
occupied = [i for i, seat in enumerate(seats) if seat == 1]


То есть мы проверяем, если значение равно 1, то это место занято и мы сохраним индекс этого места в списке

2) Далее посмотрим все не занятые места и найдем для каждого из них минимальное расстояние до занятого места и вычтем единицу и будем добавлять эти расстояния в список:
    for i, seat in enumerate(seats):
if seat == 0:
dist = min(abs(i - j) - 1 for j in occupied)
best.append(dist)


3) Отлично, теперь остается взять наибольшее значение из списка и получить ответ:
return max(best)


Итог: 🤩

🍸 Сохраняйте пост, чтобы успешно пройти собеседование
Как бы решили вы? Делать еще подобные разборы? Делитесь в комментариях!
✔️ Подпишитесь на канал, чтобы не пропустить следующие посты.

🚬 Готовлю вас к собесам и пишу резюме здесь: mentor.dima-sqlit.ru


@dima_sqlit
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳8❤‍🔥65🔥2