Я – Дата Инженер | Евгений Виндюков
4.46K subscribers
336 photos
33 videos
12 files
232 links
💵 Как стать Data Engineer
🗄 Смотри Roadmap в закрепе!
_____________________________
Автор @halltape
Все вопросы по рекламе @k_shredinger
Download Telegram
🤨 Ты не программист, если не знаешь, что такое ДжиАйТи!

Вообще это тоже самое что БиЭмДаблЮ (BMW). Или Мэйбах, а не Майбах. Или БиЭмЭкс (BMX), а не БэЭмИкс.

🔍 Причем, когда я услышал это GIT, я вообще не понял о чем он.. Хотя почти каждый день пишу git commit в терминале. На русскоязычную аудиторию уж точно привычно говорить ГИТ.

🔍 Но полез в ваши интернеты. Может я невежда и мир говорит ДжиАйТи Хаб или ДжиАйТи коммит. Но кажется нет:)

Хотя на скриншоте есть версия про Global Information Tracker.

😐 Программисты это конечно те еще душнилы, но я прям не понял о чем сказал Даня.. будто новая или другая технология. И пересмотрел кусок. Ведь я тоже могу ошибаться:)

🇺🇸 Википедия вообще говорит, что это Торвальдс придумал от английского слова . Ох уж эти американцы! И тут преуспели…Кэук

Короче, кто знает распишите откуда это слово?:)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7🤣52👍2
#️⃣#️⃣#️⃣ Ты войдешь в IT! (Но не гарантирую)

🏦 У меня в Сбере есть реферальная программа. Это значит, что я могу рекомендовать вас на позиции внутри компании. Но для этого мне нужны ваши резюме.

Кто подписан на мой канал давно, тот знает, что у меня есть посты про составление резюме, пет проекты, собеседования и прочее!

💭 И чтобы работа нашла вас, вам нужно будет скинуть мне его в ЛС @halltape. Я буду смотреть каждое резюме и давать комментарии, если посчитаю, что оно требует доработки. Плюс мне нужно познакомиться с вами и понять, что вы хотите.

Дальше я буду подбирать под вас подходящие позиции, а вам стоит быть готовым уже к собеседованиям! Настоящим! Все серьезно!

📣 Конверсия очень маленькая, поэтому расцениваете это как всего лишь возможность попробовать.

Направление IT любое!

Заодно прочекаем рынок и отклики. Да и на резюме посмотрим. Поищем инсайты!

🚀 Поехали! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍7🍾2💯1
🧐 Конкретный рабочий кейс!

Расскажу реальный случай с работы. Начну с предыстории.

✈️ Вы, как DE читаете много таблиц из разных источников. Дальше, полируете, трансформируете, вычищаете и складываете в виде одной или несколько подготовленных таблиц в БД. И это делаете каждый день (автоматически или вручную). Данные из всех источников вы читаете за одну и туже дату. Чтобы данные из разных источников смогли склеиться.

🌀 Представим, что наш код каждый день запускается по расписанию, отсчитывает от текущей даты 1 день назад и начинает грузить данные за вчера. Ну отлично. Данные успеют и в источник до грузиться, да и realtime аналитика не всегда нужна.

Что может случиться?

Вы загрузили 15 апреля, а потом ваш код упал с ошибкой, или сервер лег. Прошла неделя. На дворе 22 апреля. Сервер починили, вы запустили код, он прочитал 21 апреля. А пропущенная неделя благополучно потерялась. Че делать?

Ну давайте тогда читать максимальную дату в источнике и максимальную дату в нашей витрине и грузить разницу. Тогда 22 апреля мы подгрузим недостающий кусок. Да, будет дольше по времени, но витрина догонит в итоге источник. Круто!

Что теперь может случиться?

Вчера догнали источник по датам, сегодня грузим 22 апреля, завтра будете грузить 23 апреля и так далее. А что если за 22 апреля данные в источник не долетели и вы считали 0 строк. При этом дальше данные долетают нормально.

И вот представьте, что ваш код автоматически грузил данные и ему было все равно на кол-во строк. Ну загрузилось 0 строк и пофигу. Потом еще пару раз так происходит и вот у вас уже дыры в данных.

Теперь надо делать проверку по всем датам и искать пропущенные. И это нужно сделать на уровне кода, чтобы оно работало быстро. Потому что агрегировать терабайты данных это очень затратно и долго. Здесь не обойтись уже без обращений к партициям, о которых я писал ранее.

🧭 Собственно, какие еще краевые случаи могут быть в загрузке данных? Пишите в комменты, если возникли вопросы или есть что добавить..
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥3😭31💯1
Где и как эффективно искать работу в 2024?

Наверное самым популярным каналом по поиску работы за рубежом за последние пару лет стал LinkedIn. Почему так?

1️⃣Во-первых, потому что сама платформа предназначена для того, чтобы обрастать профессиональными знакомствами.
2️⃣А во-вторых, если тебе актуальна работа в Европе, MENA или США, проще всего найти ее именно через LinkedIn. Кстати, наши рекрутеры за последний год тоже стали активно пользоваться LD.
3️⃣И в третьих, LinkedIn можно использовать для прокачки личного бренда и продажи услуг типа консалтинга или менторинга.

Но несмотря на множество преимуществ не все пользуются этим инструментом из-за сложных настроек и алгоритмов работы с сетью. Логика работы сайта скажем прямо не очевидна. Есть множество нюансов, которые важны для эффективности результатов вашего пребывания в LinkedIn.
Эти нюансы знает Александр Лепешкин и в своем канале LinkedIn & Career | Alex Lepeshkin он делится ими.
Если для вас актуальна тема, welcome к Саше.
🔥7👏2👌2🆒2
5️⃣5️⃣ Залетел в IT в 50+!

Вот такой коммент появился к видосу на моем канале! Наваливаю вам мотивации, чтобы не бросали и шли к своей цели.

🗣 Если с опытом накрутка и его рисование еще может сработать, то с возрастом сложнее

И если бы в разработчики брали только от 20 до 30, то куда будут деваться люди после 30?) Уходят в Нарнию по всей видимости))

💻 Кстати у меня один из первых собесов был в команду, где все были за 45. И я даже чувствовал себя, что слишком молод и ребенок. Ну по ощущениям так получалось))
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾29🔥125👏1🆒1
ЕСТЬ РАБОТА!
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2💯1
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
🏦 Ищем аналитика данных в департамент маркетинга b2b сегмента. Наша команда отвечает за построение сквозной аналитики, настройку событий на сайте Сбербанка, оценку рекламных кампаний и построение аналитической отчетности

📍Локация: Москва, Кутузовский 32
В основном только офлайн

💳 Вилка ~100-250к, но не ограничено этим

☑️ Вам предстоит:
- Осуществлять маркетинговую/сквозную аналитику
- Развивать внутренние сервисы и библиотеки
- Создавать аналитические дашборды и витрины данных
- Делать исследования и составлять презентации для стейкхолдеров
- Общаться со стейкхолдерами

☑️ Что мы ожидаем:
- Опыт в аналитике от 6 месяцев
- Уверенный Python (Pandas, библиотеки визуализаций)
- SQL на продвинутом уровне (CTE, оптимизированные запросы)
- Хорошие коммуникативные навыки
- Хороший навык визуализации результатов исследований
- Желание взять на себя agile-церемонии команды (ретро, демо, дейли)

☑️Будет плюсом:
- Знания в маркетинговой и веб-аналитике
- Понимание современных web-технологий, HTML, JavaScript
- Наличие в портфолио дашбордов/презентаций

👨‍💻Стек технологий/инструментов:
Hadoop, Spark, Clickhouse, SuperSet, Airflow, GTM (внутренний аналог), Яндекс Метрика

Условия:
- Классная и дружная команда
- Непростые задачи и быстрый рост
- Корпоративное обучение
- ДМС и современный офис
- Трудоустройство согласно ТК РФ

✈️Резюме отправляйте мне @IyaZotova
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1😱1💯1🤝1
🤨 Покажите свой проект!

Вообще пет проект не сильно обязательная вещь для IT, но 1 из 10 человек на него все равно посмотрит. Да и это хорошая вещь, если надоело решать задачи на курсах или leetcode.

Пет проект вам может пригодится даже в самом банальном скилле – работа с git. Ведь код, который вы написали, очевидно можно загрузить на свой github. И здесь понадобится разобраться в нескольких вещах – настроить ssh ключи, склонировать репозиторий, разобраться, как работают ветки, commit'ы и так далее.

Плюс ко всему, пет проект не ограничивает вас ничем. Это может быть и простой телеграм бот и сложный докер контейнер, состоящий из нескольких приложений внутри. Это очень неплохой подход, чтобы не потерять мотивацию к написанию кода и при этом делать что-то творческое и интересное!

Вот подборка проектов с git:
1. Автономный тренажёр для изучения Airflow (Крайне рекомендую еще и его канал - ПОДПИШИСЬ!)
2. Telgram bot для генерации и проверки паролей
3. ETL pipeline для Дата Инженера

А вот дополнительные ресурсы, которые 100% вам пригодятся при работе с GitHub проектами!
⚫️ Изучить Git в игровой форме
⚫️ Интерактивный курс по Docker

Делитесь в комментах своими проектами и github! Интересно посмотреть!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍51💯1
Нас 🔤🔤🔤🔤!

Спасибо всем, кто подписан, ставит лайки, комментит!

🖥 Скоро год, как я веду этот канал. Могу сказать, что канал растет вместе с моими скилами. Я оч сильно бустанулся с того времени и порой забываю, как я не особо шарил за spark, pandas, хадуп, airflow и прочее. Но на реальных проектах ты не замечаешь этого, потому что требования растут с каждым спринтом, а кол-во новой информации наваливается просто, как цунами.

И те знания, за которые ты гордился в начале пути, сейчас выглядят просто примитивными навыками. В особенности, когда сравниваешь себя с опытными коллегами. Это кстати обратная сторона медали, потому что невозможно прыгнуть выше головы. У всего есть свой ресурс и предел. Невозможно бесконечно наращивать эффективность.

Пара инсайтов:

1. Работайте над софт скилами. Конфликты, сплетни, ссоры неизбежны. Никакое крутое знание фреймворка не спасет ситуацию. Это тупик.

2. Первые полгода-год на работе вы будете нон стоп учиться. Просто готовьтесь.

3. Покупать курсы не надо. Если только не мои. Мои можно. А вообще вы сами способны выучиться. Готовьте железную задницу

4. В IT не поздно. И после 30 и после 40 и после 50. Но с каждым десятком лет предвзятость будет расти.

5. Девушки в IT это супер. И я не заметил предрассудков насчет мужское направление или женское. Поэтому смело залетайте в команды!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54🍾12💯4👎2👏2
Ищем Anti Data Engineer!

📍 УДАЛЕННО (как можно дальше от главного офиса)

💵 ЗП: 3–5к рублей, до вычета налогов и штрафов (штраф за чтение описания вакансии: 1500 рублей)

Мы компания, которая в целом ничем не занимается и в дальнейшем мы тоже ничего не планируем делать. Разработка платежных систем на международном рынке – это что-то очень интересное, но не про нас. В прошлом году мы не заняли никакого места в рейтинге прорывных компаний, потому что нам нечего было показывать. У нас в целом нет общего видения развития индустрии, нам вообще это неинтересно от слова совсем.

➡️ На данный момент ищем очень слабого data engineer на новый DWH проект.

➡️ Требования:
⚫️ Неумение работать с большими объемами данных. Если вы путаетесь в террабайтах данных, вы идеальный кандидат!
⚫️ Отсутствие опыта работы с инструментами для обработки и анализа данных. Никогда не слышали о Hadoop, Spark, Hive, Pig, или других подобных инструментах? Отлично, приглашаем на собеседование!
⚫️ Обязательное незнание SQL. Если вы думаете, что SQL - это что-то связанное с экстрасенсорным восприятием, вы тот, кто нам нужен
⚫️ Неумение визуализировать данные. Отсутствие желания работы с любыми BI системами.
⚫️ Если pandas для вас – это то, по чему поднимаются коляски в подъезд, значит вы на на правильном пути
⚫️ Знание python на уровне, что есть такое животное. Не выше!
⚫️ Уметь удалять нужный код коллег из BitBucket
⚫️ Продвинутые навыки в DROP TABLE (желательно on CLUSTER)
⚫️ Отсутствие любых знаний в области computer science
⚫️ Умение растягивать примитивные SQL запросы на 800 строк и больше (без знания SQL)

🖥 Обязанности:
⚫️Своевременно и безвозвратно удалять данные из БД
⚫️Писать неэффективный код от 2000 строк в день (у нас строгий подсчет, мы ведем журналы!)

🔥Наши плюшки:
⚫️ Мы не пересматриваем ЗП (нечего пересматривать)
⚫️Технику не выдаем (только штрафы)
⚫️ДМС нет, но ноги вам с радостью сломаем
⚫️Компенсация фитнеса (из вашей зарплаты)
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46🔥9🤣8💩21
🥲 Оффер за самое элегантное решение!

Две строки. Нужно из них получить python словарь. Побеждает самое короткое простое, но ПОНЯТНОЕ решение.

Столкнулся на работе. Эти строки – это значения в двух столбцах огромной таблицы. Поэтому при желании можете также оценить O(n).

P.S. Здесь требуется решение на питоне, но у меня конечно на самом деле был spark и там есть некоторые нюансы. Я комментах его опишу, потому что оно ДУШНОЕ и если вы новичек, то не забивайте себе голову и смело скипайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👎1🔥1💯1
👩‍💻 Очень четко про ИНДЕКСЫ в PostgreSQL!
.
Рекомендую смотреть только тем, кого не пугают такие слова:
⚫️ B-tree индексы
⚫️ Explain analyse
⚫️ VACUUM

Парень рассказывает по то, как стоит использовать индексы, в чем разница индексов по двум и более полям и многое другое.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥274
🥲 За решение даю гектар на Рублевке!

Смотрите, тут написана фраза "Ограничение по памяти O(1)" – это не тоже самое, что сложность алгоритма. Строка s не должна быть создана еще раз в памяти. Создавать переменные можно. Варианты со срезами не подходят. Не пройдут тесты.

Пишите в комменты свои варианты. Я обязательно выложу и свой вариант. Уверен, что кто-то из вас сможет предложить прям элегантное решение!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍3💯2
⚡️⚡️⚡️Удаленка Мир! (DE)

💸 до 220к на руки

Требования:
• Опытом работы на позиции дата-инженера от 1 года;
• Уверенным владением SQL;
• Уверенным владением Python;
• Уверенным владением Apache Airflow 2;
• Уверенным владением bash;
• Опытом разработки ETL, проектирования и разработки хранилищ данных и аналитической отчетности (просим рассказать Ваши кейсы);
• Способностью анализировать;
• Опытом работы с ClickHouse, Kafka, S3 и dbt.
• Высшим техническим или другим релевантным образованием;
• Владением английским языком на уровне B2 и выше.

Подробнее:
здесь

Писать:
@tanya_zab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2👌2😁1💯1
🅱️🩸🩸🩸🩸
Наконец-то куплю трешку на Патриках!

Сразу к делу! Думаю о том, чтобы завести бусти.

И вот, что вы получите:
1. Еженедельные созвоны (от обсуждения технологий и работы до сплетней, денег и скандалов)
2. Задачи и вопросы с реальных собеседований (+ условия, описание проекта и так далее). А возможно даже и записи с собесов!
3. Закрытый чат для подписчиков (никаких лишних глаз, любое NDA станет не NDA)
4. Мастер-классы по софт скиллам (это я для прикола написал, но может кто-то хочет побороть страх. Можем попробовать поработать)

Зачем я это делаю?
Я хочу заработать на хаты на патриках и начать разыгрывать их в канале за правильное решенные задачи.

🩸 Сколько это будет стоить денег?
Хочу 500 руб / месяц. Зависит от трафика.

🩸 Ставьте реакции и пишите в комменты что думаете можно было бы добавить. Если считаете, что я офигел, то это правда)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25🗿19😁7😢42
👍 А вы бы их взяли на работу?

Это не реклама, но видос годный.

Есть два кандидата:
Один с хардами, но мертвый, другой общительный, но слабый на харды. Кого возьмете, кого лесом пошлете?
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥4💯1
👩‍💻 Индексы в PostgreSQL!
.
b-tree | hash | brin | gist | sp_gist

Для тех, кто прям преисполнился в постгре, есть ДВА ЧАСА класного материала про индексы в БД!
Тема большая, словно океан, поэтому всегда можете возвращаться к этому докладу в течение обучения и работы!

🔗 И давайте так. Если вкатываетесь в IT, то знать какие индексы бывают ХОРОШО. Но не надо убиваться по каждому из них. Во первых не запомните, а во вторых на первой работе у вас может быть вообще spark, вместо postgre и тогда эта информация забудется еще быстрее.

Всегда успеете вернуться сюда и посмотреть!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍31💯1
🥲 Однострочники, ваш выход!

Когда я на степике решал задачки, то меня бесили однострочники в комментах. Эти люди предлагали свои решения в одну строку, когда ты написал 30.

В одной строке есть колоссальный плюс до того момента, пока она читабельна. В ином случае, решение лучше расписывать и не выкобениваться. Надо учитывать и время, которое потратит человек, когда будет читать ваш гениальный код!

Задача: Надо вывести 1, если из первой строки можно собрать вторую строку. И 0, если нельзя

В комментах интересны самые короткие решения! Но можете делиться и полотнами))
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥3👌3❤‍🔥2
💵 За правильный ответ даю оффер на лям!

Сходу отвечаем на вопросы HR:

1. Почему уходишь с нынешней работы?
2. Сколько хочешь денег?
3. Что для тебя красный флаг в команде?


К слову вы обязаны спрашивать и ту сторону. Можете прямо проводить собеседование им. Пусть рассказывают о себе также подробно, как и вы. Вам потом с этими людьми работать между прочим.

1. Расскажите типичную задачу на работе. Подробно, где пишите код, кто его проверяет или так без код ревью в прод?
2. Команду собираете с нуля или на замену того, кто ушел? А DevOps будет, который будет сервисы поднимать или на меня повесите?
3. Что из стека в вакансии вы реально используете, а что в планах использовать?


Очевидно, что не только вы можете быть с сюрпризом, но и команда. Поэтому прагматичней подходите к таким делам. Что, если команда разваливается или вы будете там единственным спецом, а может это вообще будет команда из стажеров и никакой экспертности. Спрашивайте про бюрократию. Про системного аналитика. Короче ковыряйте больные места у работодателей. Иначе в будущем их придется ковырять вам.

Пишите в комменты свои вопросы рекрутерам и командам на собесе!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13💯6🔥3👾1