Я – Дата Инженер | Евгений Виндюков
4.47K subscribers
336 photos
33 videos
12 files
232 links
💵 Как стать Data Engineer
🗄 Смотри Roadmap в закрепе!
_____________________________
Автор @halltape
Все вопросы по рекламе @k_shredinger
Download Telegram
5️⃣5️⃣ Залетел в IT в 50+!

Вот такой коммент появился к видосу на моем канале! Наваливаю вам мотивации, чтобы не бросали и шли к своей цели.

🗣 Если с опытом накрутка и его рисование еще может сработать, то с возрастом сложнее

И если бы в разработчики брали только от 20 до 30, то куда будут деваться люди после 30?) Уходят в Нарнию по всей видимости))

💻 Кстати у меня один из первых собесов был в команду, где все были за 45. И я даже чувствовал себя, что слишком молод и ребенок. Ну по ощущениям так получалось))
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾29🔥125👏1🆒1
ЕСТЬ РАБОТА!
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2💯1
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
🏦 Ищем аналитика данных в департамент маркетинга b2b сегмента. Наша команда отвечает за построение сквозной аналитики, настройку событий на сайте Сбербанка, оценку рекламных кампаний и построение аналитической отчетности

📍Локация: Москва, Кутузовский 32
В основном только офлайн

💳 Вилка ~100-250к, но не ограничено этим

☑️ Вам предстоит:
- Осуществлять маркетинговую/сквозную аналитику
- Развивать внутренние сервисы и библиотеки
- Создавать аналитические дашборды и витрины данных
- Делать исследования и составлять презентации для стейкхолдеров
- Общаться со стейкхолдерами

☑️ Что мы ожидаем:
- Опыт в аналитике от 6 месяцев
- Уверенный Python (Pandas, библиотеки визуализаций)
- SQL на продвинутом уровне (CTE, оптимизированные запросы)
- Хорошие коммуникативные навыки
- Хороший навык визуализации результатов исследований
- Желание взять на себя agile-церемонии команды (ретро, демо, дейли)

☑️Будет плюсом:
- Знания в маркетинговой и веб-аналитике
- Понимание современных web-технологий, HTML, JavaScript
- Наличие в портфолио дашбордов/презентаций

👨‍💻Стек технологий/инструментов:
Hadoop, Spark, Clickhouse, SuperSet, Airflow, GTM (внутренний аналог), Яндекс Метрика

Условия:
- Классная и дружная команда
- Непростые задачи и быстрый рост
- Корпоративное обучение
- ДМС и современный офис
- Трудоустройство согласно ТК РФ

✈️Резюме отправляйте мне @IyaZotova
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1😱1💯1🤝1
🤨 Покажите свой проект!

Вообще пет проект не сильно обязательная вещь для IT, но 1 из 10 человек на него все равно посмотрит. Да и это хорошая вещь, если надоело решать задачи на курсах или leetcode.

Пет проект вам может пригодится даже в самом банальном скилле – работа с git. Ведь код, который вы написали, очевидно можно загрузить на свой github. И здесь понадобится разобраться в нескольких вещах – настроить ssh ключи, склонировать репозиторий, разобраться, как работают ветки, commit'ы и так далее.

Плюс ко всему, пет проект не ограничивает вас ничем. Это может быть и простой телеграм бот и сложный докер контейнер, состоящий из нескольких приложений внутри. Это очень неплохой подход, чтобы не потерять мотивацию к написанию кода и при этом делать что-то творческое и интересное!

Вот подборка проектов с git:
1. Автономный тренажёр для изучения Airflow (Крайне рекомендую еще и его канал - ПОДПИШИСЬ!)
2. Telgram bot для генерации и проверки паролей
3. ETL pipeline для Дата Инженера

А вот дополнительные ресурсы, которые 100% вам пригодятся при работе с GitHub проектами!
⚫️ Изучить Git в игровой форме
⚫️ Интерактивный курс по Docker

Делитесь в комментах своими проектами и github! Интересно посмотреть!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍51💯1
Нас 🔤🔤🔤🔤!

Спасибо всем, кто подписан, ставит лайки, комментит!

🖥 Скоро год, как я веду этот канал. Могу сказать, что канал растет вместе с моими скилами. Я оч сильно бустанулся с того времени и порой забываю, как я не особо шарил за spark, pandas, хадуп, airflow и прочее. Но на реальных проектах ты не замечаешь этого, потому что требования растут с каждым спринтом, а кол-во новой информации наваливается просто, как цунами.

И те знания, за которые ты гордился в начале пути, сейчас выглядят просто примитивными навыками. В особенности, когда сравниваешь себя с опытными коллегами. Это кстати обратная сторона медали, потому что невозможно прыгнуть выше головы. У всего есть свой ресурс и предел. Невозможно бесконечно наращивать эффективность.

Пара инсайтов:

1. Работайте над софт скилами. Конфликты, сплетни, ссоры неизбежны. Никакое крутое знание фреймворка не спасет ситуацию. Это тупик.

2. Первые полгода-год на работе вы будете нон стоп учиться. Просто готовьтесь.

3. Покупать курсы не надо. Если только не мои. Мои можно. А вообще вы сами способны выучиться. Готовьте железную задницу

4. В IT не поздно. И после 30 и после 40 и после 50. Но с каждым десятком лет предвзятость будет расти.

5. Девушки в IT это супер. И я не заметил предрассудков насчет мужское направление или женское. Поэтому смело залетайте в команды!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54🍾12💯4👎2👏2
Ищем Anti Data Engineer!

📍 УДАЛЕННО (как можно дальше от главного офиса)

💵 ЗП: 3–5к рублей, до вычета налогов и штрафов (штраф за чтение описания вакансии: 1500 рублей)

Мы компания, которая в целом ничем не занимается и в дальнейшем мы тоже ничего не планируем делать. Разработка платежных систем на международном рынке – это что-то очень интересное, но не про нас. В прошлом году мы не заняли никакого места в рейтинге прорывных компаний, потому что нам нечего было показывать. У нас в целом нет общего видения развития индустрии, нам вообще это неинтересно от слова совсем.

➡️ На данный момент ищем очень слабого data engineer на новый DWH проект.

➡️ Требования:
⚫️ Неумение работать с большими объемами данных. Если вы путаетесь в террабайтах данных, вы идеальный кандидат!
⚫️ Отсутствие опыта работы с инструментами для обработки и анализа данных. Никогда не слышали о Hadoop, Spark, Hive, Pig, или других подобных инструментах? Отлично, приглашаем на собеседование!
⚫️ Обязательное незнание SQL. Если вы думаете, что SQL - это что-то связанное с экстрасенсорным восприятием, вы тот, кто нам нужен
⚫️ Неумение визуализировать данные. Отсутствие желания работы с любыми BI системами.
⚫️ Если pandas для вас – это то, по чему поднимаются коляски в подъезд, значит вы на на правильном пути
⚫️ Знание python на уровне, что есть такое животное. Не выше!
⚫️ Уметь удалять нужный код коллег из BitBucket
⚫️ Продвинутые навыки в DROP TABLE (желательно on CLUSTER)
⚫️ Отсутствие любых знаний в области computer science
⚫️ Умение растягивать примитивные SQL запросы на 800 строк и больше (без знания SQL)

🖥 Обязанности:
⚫️Своевременно и безвозвратно удалять данные из БД
⚫️Писать неэффективный код от 2000 строк в день (у нас строгий подсчет, мы ведем журналы!)

🔥Наши плюшки:
⚫️ Мы не пересматриваем ЗП (нечего пересматривать)
⚫️Технику не выдаем (только штрафы)
⚫️ДМС нет, но ноги вам с радостью сломаем
⚫️Компенсация фитнеса (из вашей зарплаты)
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46🔥9🤣8💩21
🥲 Оффер за самое элегантное решение!

Две строки. Нужно из них получить python словарь. Побеждает самое короткое простое, но ПОНЯТНОЕ решение.

Столкнулся на работе. Эти строки – это значения в двух столбцах огромной таблицы. Поэтому при желании можете также оценить O(n).

P.S. Здесь требуется решение на питоне, но у меня конечно на самом деле был spark и там есть некоторые нюансы. Я комментах его опишу, потому что оно ДУШНОЕ и если вы новичек, то не забивайте себе голову и смело скипайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👎1🔥1💯1
👩‍💻 Очень четко про ИНДЕКСЫ в PostgreSQL!
.
Рекомендую смотреть только тем, кого не пугают такие слова:
⚫️ B-tree индексы
⚫️ Explain analyse
⚫️ VACUUM

Парень рассказывает по то, как стоит использовать индексы, в чем разница индексов по двум и более полям и многое другое.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥274
🥲 За решение даю гектар на Рублевке!

Смотрите, тут написана фраза "Ограничение по памяти O(1)" – это не тоже самое, что сложность алгоритма. Строка s не должна быть создана еще раз в памяти. Создавать переменные можно. Варианты со срезами не подходят. Не пройдут тесты.

Пишите в комменты свои варианты. Я обязательно выложу и свой вариант. Уверен, что кто-то из вас сможет предложить прям элегантное решение!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍3💯2
⚡️⚡️⚡️Удаленка Мир! (DE)

💸 до 220к на руки

Требования:
• Опытом работы на позиции дата-инженера от 1 года;
• Уверенным владением SQL;
• Уверенным владением Python;
• Уверенным владением Apache Airflow 2;
• Уверенным владением bash;
• Опытом разработки ETL, проектирования и разработки хранилищ данных и аналитической отчетности (просим рассказать Ваши кейсы);
• Способностью анализировать;
• Опытом работы с ClickHouse, Kafka, S3 и dbt.
• Высшим техническим или другим релевантным образованием;
• Владением английским языком на уровне B2 и выше.

Подробнее:
здесь

Писать:
@tanya_zab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2👌2😁1💯1
🅱️🩸🩸🩸🩸
Наконец-то куплю трешку на Патриках!

Сразу к делу! Думаю о том, чтобы завести бусти.

И вот, что вы получите:
1. Еженедельные созвоны (от обсуждения технологий и работы до сплетней, денег и скандалов)
2. Задачи и вопросы с реальных собеседований (+ условия, описание проекта и так далее). А возможно даже и записи с собесов!
3. Закрытый чат для подписчиков (никаких лишних глаз, любое NDA станет не NDA)
4. Мастер-классы по софт скиллам (это я для прикола написал, но может кто-то хочет побороть страх. Можем попробовать поработать)

Зачем я это делаю?
Я хочу заработать на хаты на патриках и начать разыгрывать их в канале за правильное решенные задачи.

🩸 Сколько это будет стоить денег?
Хочу 500 руб / месяц. Зависит от трафика.

🩸 Ставьте реакции и пишите в комменты что думаете можно было бы добавить. Если считаете, что я офигел, то это правда)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25🗿19😁7😢42
👍 А вы бы их взяли на работу?

Это не реклама, но видос годный.

Есть два кандидата:
Один с хардами, но мертвый, другой общительный, но слабый на харды. Кого возьмете, кого лесом пошлете?
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥4💯1
👩‍💻 Индексы в PostgreSQL!
.
b-tree | hash | brin | gist | sp_gist

Для тех, кто прям преисполнился в постгре, есть ДВА ЧАСА класного материала про индексы в БД!
Тема большая, словно океан, поэтому всегда можете возвращаться к этому докладу в течение обучения и работы!

🔗 И давайте так. Если вкатываетесь в IT, то знать какие индексы бывают ХОРОШО. Но не надо убиваться по каждому из них. Во первых не запомните, а во вторых на первой работе у вас может быть вообще spark, вместо postgre и тогда эта информация забудется еще быстрее.

Всегда успеете вернуться сюда и посмотреть!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍31💯1
🥲 Однострочники, ваш выход!

Когда я на степике решал задачки, то меня бесили однострочники в комментах. Эти люди предлагали свои решения в одну строку, когда ты написал 30.

В одной строке есть колоссальный плюс до того момента, пока она читабельна. В ином случае, решение лучше расписывать и не выкобениваться. Надо учитывать и время, которое потратит человек, когда будет читать ваш гениальный код!

Задача: Надо вывести 1, если из первой строки можно собрать вторую строку. И 0, если нельзя

В комментах интересны самые короткие решения! Но можете делиться и полотнами))
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥3👌3❤‍🔥2
💵 За правильный ответ даю оффер на лям!

Сходу отвечаем на вопросы HR:

1. Почему уходишь с нынешней работы?
2. Сколько хочешь денег?
3. Что для тебя красный флаг в команде?


К слову вы обязаны спрашивать и ту сторону. Можете прямо проводить собеседование им. Пусть рассказывают о себе также подробно, как и вы. Вам потом с этими людьми работать между прочим.

1. Расскажите типичную задачу на работе. Подробно, где пишите код, кто его проверяет или так без код ревью в прод?
2. Команду собираете с нуля или на замену того, кто ушел? А DevOps будет, который будет сервисы поднимать или на меня повесите?
3. Что из стека в вакансии вы реально используете, а что в планах использовать?


Очевидно, что не только вы можете быть с сюрпризом, но и команда. Поэтому прагматичней подходите к таким делам. Что, если команда разваливается или вы будете там единственным спецом, а может это вообще будет команда из стажеров и никакой экспертности. Спрашивайте про бюрократию. Про системного аналитика. Короче ковыряйте больные места у работодателей. Иначе в будущем их придется ковырять вам.

Пишите в комменты свои вопросы рекрутерам и командам на собесе!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13💯6🔥3👾1
🧐 Каждый DE точно должен это знать!

Речь идет про

SCD - Медленно меняющимися измерения (Slowly Changing Dimensions)

Если вы сейчас вообще не поняли, что это, то либо вам еще рано, либо прямо сейчас начинайте изучать. Например вы записали в хадуп данные о себе, что у вас 100 рублей на счете. А потом поняли, что хотите больше, а функции update таблицы нет! Нельзя поменять значение, где 100 рублей и поставить 1 000 000. Вам либо стирать таблицу и перезаписывать, либо фильтровать и перезаписывать, либо использовать SCD. Сейчас объясню что это.

SCD позволяет вести историчность строки. Не просто поменять значение в ячейке, а именно контроллировать даты, когда меняется значение. При этом старое значение не удаляется.

Если очень коротко про SCD в HADOOP:
Каждая строка имеет еще один или два столбца с датой. Эта дата обозначает актуальность строки. Например я записал строку 1 июня со значением баланса счета в 100 рублей. А потом 15 июня я выиграл миллион и записал строку с балансом счета в 1 000 100 рублей. Получается у меня две строки с разными датами. И очевидно, что актуальной информацией является строка от 15 июня. При этом я смогу также посмотреть историчность. Это конечно касается Hadoop. Там можно только добавлять данные или стирать вовсе. Поэтому у меня в одной из витрин некоторые строки обновляются именно по такой логике. Есть реально поле, которое содержит в себе дату и чем она позже, тем актуальней данные))

Но по факту в транзакционных системах конечно можно идти дальше и хранить значение, как начала жизни строки, так и конца.
Например у вас два столбца:

start_dt и end_dt


В start_dt пишите 2024-06-01, а в end_dt пишите 9999-12-31. И когда информация обновилась, то вместо 9999-12-31 (столбец end_dt) вы пишите 2024-06-14 (тут именно транзакция). И дальше записываете новую строку, где start_dt пишите 2024-06-15, а в end_dt 9999-12-31.

Таким образом видно, когда строка обновилась (какие были данные и так далее). Добавлять таких строк можно сколько угодно. Плюс в том, что у нас историчность. Минус в том, что куча данных, дополнительных столбцов и стремительно растет нагрузка!

Я рассказал именно про SCD2. Но их всего 5 версий.
SCD1 - это просто изменить значение в ячейке.
SCD3 - это когда у вас хранится предыдущее значение ячейки в соседнем столбце.
SCD4 - это когда основная таблица перезаписывает данные, а старые улетают в отдельную таблицу

Остальные SCD уже являются комбинациями предыдущих и сильно усложняют подход.
Ну кстати мой пример с Хадуп не совсем прям SCD2, но подход похожий. Я просто считаю, что дата окончания актуальности предыдущей строки - это дата добавления новой.
Прикрепляю скрины с Карпов Курсес про SCD. Мне очень нравится, как у них описано это в лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥14👎21😴1