Я – Дата Инженер
4.33K subscribers
343 photos
33 videos
12 files
242 links
💻 Как войти в IT?
💵 Как стать Data Engineer
🗄 Что такое Big Data и кто ей управляет?
_____________________________
Автор @halltape
Все вопросы по рекламе @k_shredinger
Download Telegram
Спасибо за СТРИМ!

▶️YouTube

Бот для просмотра YouTube
@NamelessNetwork_bot

Промокод: DE
(FREE 2 недели)

Ссылка на доску MIRO
19🔥12👍4👏2
🟢 Обновление по Apache Spark!

Я расширил Roadmap для Data Engineer — теперь там есть материалы как для начинающих, так и для продвинутых DE по Spark!

📘 Для новичков:
• Папка SPARK/BASE содержит основы Spark. Что это такое, как он работает и т.д.

🚀 Для продвинутых:
• Папка SPARK/ARCHITECTURE - устройство Spark внутри
• Папка SPARK/ADVANCED охватывает темы оптимизации, join, shuffle, data skew, хинты и прочее.

Если ты только начинаешь или уже готовишься к реальным проектам — заходи, изучай, применяй! Буду рад обратной связи и предложениям по улучшению материала. 🚀

Если хочешь стать автором одного из разделов, делай fork репозитория и кидай PR!
Инструкция для новых авторов
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6216👏14👍3
МЕНЯ БЕСЯТ ЭТИ КОММЕНТЫ!

Я когда учился, меня сильно бесило, что очень мало объяснений для тупых и новичков. Многие объяснения – это сразу огромные СТАТЬИ, в которых вообще не понимаешь практическое применение.

Как объяснить "бабушке", что такое Кафка, Спарк, Хадуп?

Вот я помню, как видел, что люди пишут: Мы читаем данные из Кафки. А как это? Есть ли у нее интерфейс? Как выглядят данные там?

И в своих стримах я делюсь ЛИЧНЫМ ОПЫТОМ взаимодействия. Какой смысл говорить о партициях в Кафке, если люди могут не понимать, как эта Кафка вообще выглядит?

Меня бесят умники, которые мне пишут, что ТАК НЕЛЬЗЯ ГОВОРИТЬ!

Этот стрим не про Кафку, а про архитектуру ДВХ. У МЕНЯ БОМБИТ!

Знаете, меня бесило, что когда я учился, не было людей, кто рассказывал про конкретный рабочий процесс. Куда заходим, в какие программы, какой код пишем и где самое главное. Везде были эти ОБЩИЕ СЛОВА ->> ETL, ELT. А как оно на деле выглядит нихрена не понятно.

Дайте поддержку, плиз!

МЕНЯ БОМБИТ!!!
🔥158👍31👏106😁1
▶️Обновление курса(RoadMap) на версию 2.1▶️

В этом видео:

Материал разделён по уровням: Junior, Junior+ и выше;
Добавлена информация по Spark(Junior, Junior+, Middle, Senior);
Обновлена информация по Hadoop(Junior, Junior+);
Новый соавтор курса — Артем Подвальный;
Новый соавтор курса — Анна Бобкова;
Добавлен новый контент по GreenPlum(Junior+, Middle);
Разделены вопросы собеседований по темам;
Добавлен новый контент в темы - «Вопросы собеседований по SQL и Базам Данных»(Junior, Junior+);
Добавлена информация для людей, которые хотят стать соавторами данного детища;
Рассказываю - что планируется внести в версию 2.2 + о планах ведения телеграмм каналов + проведения стримов + введения подкастов + рассуждаю о мыслях проведения 3-4 месячных интенсивов с нуля до тех.собеса.

Если у тебя есть идеи, предложения, обратная связь и т.д., можешь написать, как в комментариях под этим постом⬇️, так и в личку — либо мне, либо Евгению! Мы всегда ЗА рациональные идеи!
Please open Telegram to view this post
VIEW IN TELEGRAM
33👍14🔥13
⚡️Анализируем продажи на Wildberries с помощью Python

С каждым днем все больше бизнесов выходят на маркетплейсы, а значит еще более ценными становятся аналитики, которые умеют с ними работать. Хотите за несколько часов собрать интересный кейс для своего портфолио?

Андрон Алексанян - эксперт по аналитике с 8 летним опытом и по совместительству CEO Simulative в прямом эфире проанализирует продажи на Wildberries с помощью Python.

Что будет на вебинаре:

🟠Напишем скрипт на Python, который каждый час собирает статистику о ранжировании карточки на WB по ключевым запросам;
🟠Построим наглядные визуализации для отслеживания динамики ранжирования.

Важно досмотреть вебинар до конца, чтобы узнать как упаковать этот кейс в портфолио своих проектов.

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9🤔2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Сколько можно лезть к нам в DE?

Видео создано исключительно в юмористических целях и не несет под собой цели ввести вас в заблуждение
🔥25😁18👍116😱1
👍 Обновляю Пет Проект!

Неплохо так пересобрал свой ETL pipeline и теперь там есть Streaming + Batch. Это я собираю новую архитектуру с этого стрима и скорее всего она и будет в БУТКЕМПЕ в итоге!

На какой стадии сейчас:
🔵 В postgres автоматически наполняются таблицы + сами обновляют строки. Debezium считывает все изменения и закидывает в Kafka. Оттуда уже Spark Streaming льет в S3 бакет и раскладывает по партициям. Настроены heartbeat + signal таблицы.
🔵Почти тоже самое со второй таблицей, но уже настроен просто забор данных батчом.
🔵Появились prometheus и grafana для отслеживание метрик (но пока еще не настроил)
🔵Автоматизировал создание БД и табличек на стадии docker-compose (чтобы все ставилось с одной кнопки)
🔵Хранилище в реальном MinioS3 (раньше просто сохранялось в файловую систему)

Хочу сделать:
🔵 Добавить слои clean и mart в S3(сейчас только raw слой)
🔵 Написать spark джобы для построения витрин и складывания их в Clickhouse
🔵 Переписать старые airflow dags на новую архитектуру
🔵 Добавить Trino от CedrusData (у них есть free docker image)
🔵 Добавить Iceberg, либо продумать иной вариант обновления строк

Эта версия пока доступна в соседней ветке
Кто хочет, может внести свои правки и идеи, если есть желание. Более менее финальную версию дропну позже.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👏87👍2
Запуск буткемпа!

Вообще, основная цель буткемпа — оффер через 3 месяца

И для этого совсем не нужно учить весь Python или проходить тонну теории, как на курсах. Мы специально вырезаем весь лишний и ненужный материал, который не пригодится ни на собесах, ни на работе.

Что нужно для оффера?
🔵Резюме, которое проходит фильтры HR
🔵Пет-проект с нормальным ETL-пайплайном: батч, стриминг, API
🔵Понимание, как выстроить процесс от начала до конца: от источника до витрины
🔵Умение работать с Airflow, Spark, Greenplum, ClickHouse, Python, SQL (базово!)
🔵Навыки работы с Docker и командной строкой
🔵Умение отвечать на типичные вопросы с собесов

Все.
Остальное — избыточный багаж. Например, зачем учить MapReduce, если ты никогда не будешь это писать? Это легаси, которое давно уже закрыто фреймворками.

Мы смотрим на буткемп, как на симуляцию первой работы.
Представь, что ты уже устроился, и у тебя есть тимлиды. Мы и есть эти тимлиды. Мы даём задачи, показываем, как их решать, помогаем, если что-то не работает. Ты не учишься — ты работаешь.

Это важный момент: на первой работе от тебя никто не будет ждать глубоких теоретических знаний. Все, что нужно — это писать базовый код, запускать пайплайны и уметь решать реальные задачи. Вот этому мы и учим.

У всех Data Engineers задачи примерно одинаковые. Мы всё равно тянем данные, обрабатываем, кладем в хранилище. Отличия — только в стекe и мощности серверов.

🔴 В скором времени скину ссылку на чат ДЛЯ ВСЕХ, где можно будет посмотреть на ПЛАН БУТКЕМПА, задать вопросы, накидать идей, если у вас есть конкретная боль.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7118🔥13🤔5
🐯 Ищем Data-инженера в Outlines Tech

Outlines Tech — аккредитованная IT-компания и технологический партнёр для бизнеса. Разрабатываем ПО и поставляем IT-ресурсы. Получили награды как одни из лучших работодателей по версиям Forbes, РБК и hh.ru. Больше информации о нас — в карточках ☝️

Ищем Data-инженера с опытом работы в финансах или в казначействе в команду ценообразования кредитных предложений для розничного бизнеса 🔎

🐯 Задачи:
— Внедрять новые алгоритмы фондирования
— Работать с новыми источниками данных
— Документировать алгоритмы и бизнес-процессы
— Сопровождать задачи: от постановки и разработки до тестирования и вывода в прод
— Разбирать текущую методологию и участвовать в улучшении бизнес-процессов
— Контролировать сроки и качество выполнения задач

💼 Узнать, что предлагаем и откликнуться можно на hh.ru

А если вакансия для вас неактуальна, то поделитесь постом с друзьями. За трудоустройство по вашей рекомендации выплатим 70 000 рублей! 👉 Подробнее

Больше вакансий и отзывы о компании найдете здесь 👉 Здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍118🔥4😁1
Какой комп лучше?

Ваш комп не будет запускать расчеты локально, поэтому достаточно, чтобы тянул несколько открытых Pycharm, dbeaver, docker и много вкладок браузера.

Рекомендую MacBook Pro или Air m1 и выше (14 диагональ 16 Gb). Эту диагональ удобно таскать с собой, при этом в ней все еще можно работать с кодом.

Если на работе выдают такие компы, отлично, вам повезло.

Но есть варианты, когда вам будут выдавать просто винду (хуавей, асус или леново). В целом ок, если там дорогой ноут с хорошим экраном. Конечно, я всегда подключаю второй монитор, но и мелким экраном тоже пользуюсь.

Самый худший вариант - это выдача дешевого ноута с подключением удаленного рабочего стола и с кучей запретов на пользование chat gpt, телеги и так далее.

Это наверное самое неудобное. Хотя если за страдания доплачивать, то мб и норм)

А за сколько тогда человек готов будет на глиняных табличках например работать? )
🔥14👍6😁53
У ML-инженеров одна из самых высоких зарплат на старте — 80-100 тысяч рублей в месяц. И спрос на специалистов хороший. Но есть нюанс — чтобы в нынешних реалиях уверенно стартовать в профессии, надо уметь немного больше, чем джуны-конкуренты.

Мы в karpovꓸcourses знаем, чего хотят эйчары, поэтому для старта в инженерии машинного обучения рекомендуем брать дуэт курсов: «Инженер машинного обучения» и «Симулятор A/B-тестов».

На практике научитесь:

Строить ML-модели, отвечающие задачам бизнеса;
Запускать и анализировать A/B-тесты;
Работать с метриками, гипотезами и бизнес-целями.

Погрузитесь в полный цикл работы ML-инженера. Выполните более 600 заданий и реальный проект для портфолио. Получите карьерную помощь в поиске первой работы.

До 31 мая стоимость двух курсов на 15% ниже. Воспользуетесь выгодой для уверенного старта в IT.


Реклама. ООО «Карпов Курсы», ИНН: 7811764627, erid: 2VtzqwXtTGg
😁18🔥62🤔2👏1
Forwarded from Sravni Tech
#SravniTechPodcast

Стажировок мало, а джуны должны уметь всё: как становятся ИТ-специалистом в 2025 году

В новом выпуске Sravni Tech Podcast этот вопрос детально обсудили наши гости-эксперты:

🗣Наталья Рыжова, руководитель Центра карьеры в МГТУ им. Баумана
🗣Евгений Виндюков, дата-инженер и автор телеграм-канала о том, как попасть в ИТ

В выпуске:

- Карьера в ИТ «с нуля». Пет-проекты заменяют реальный опыт?
- Пойти на стажировку vs попробовать сразу устроиться джуном
- Пожарный хочет стать айтишником. Когда карьерный переход имеет смысл?
- Успешный старт в компании: софт-скиллы, онбординг, наставники

Посмотреть подкаст можно здесь:

YouTube
RUTUBE
VK

А послушать — здесь:

Mave
Плеер в ТГ

Оставляйте реакции, делитесь ссылкой (не только с пожарными)! 📣
🔥32👍86
⚡️Пошаговый план: как стать аналитиком данных в 2025

Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?

Андрон Алексанян — эксперт по аналитике с 8-летним опытом и по совместительству CEO Simulative — покажет рабочие схемы и чёткий план, как устроиться в аналитику быстрее, даже если у вас нет опыта

Что будет на вебинаре?

🟠 Разберёте полный роадмап: что учить, в каком порядке, до какого уровня;
🟠 Лайфхаки трудоустройства:
— покажут реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— обсудите, какие отклики работают, а какие сразу отправляют в корзину;
— изнанка найма: инсайдерский взгляд на процессы отбора
🟠 Практические техники для новичков: разберёте, как компенсировать недостаток опыта и быстро закрывать пробелы в знаниях

🕗 Важно досмотреть вебинар до конца, чтобы получить бонус от Simulative, который поможет бустануть карьеру

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
😁103
В IT только по призванию!

Итак, наваливаю вам базы! Мы, люди, живем слишком короткую жизнь и если вам какой-то умник затирает про призвание в жизни, разворачивайтесь и уходите. Значит, спускаемся с небес на землю. Речь не идет о становлении математиком, чтобы доказать теорему Пуанкаре. Вы тупо можете освоить базовые профессии, где можно лутать норм бабки. Для этого не надо быть гением. Для этого надо вовремя и правильно поставить цель и ежедневно заниматься, осваивая только ТО, ЧТО ТРЕБУЕТ РЫНОК.

Когда IT схлопнется и SkyNet наконец-то заменит программистов, я переучусь на СВАРЩИКА ИЛИ ТОКАРЯ и также заведу канал Я – Токарь или Я – Фермер (как в Интерстелларе). Но, к сожалению, AI еще настолько тупой, что походу не скоро я еще смогу начать выращивать кукурузу!

Ближе к делу. В видосе можете услышать главную идею: Стать можно кем угодно в этой жизни, если вы раскачаете нужные навыки. Здесь нет ни слова про генетику или божий дар. Мы говорим с вами про профессию наемного сотрудника... Это просто БАЗА.

▶️ ссылка на видос

Бот для просмотра YouTube
@NamelessNetwork_bot
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍9👏62
Кто идет на Spark Meetup? 29 мая
Anonymous Poll
14%
Иду
45%
Не иду
41%
Онлайн
Bootcamp чат для ВСЕХ!

Открыли чат с программой Буткемпа для ВСЕХ!

ссылка на чат

Заходите все, кто думает пройти буткемп, залететь наконец-то в IT или просто из интереса. Внутри есть программа обучения. Мы ждем пожелания и боли от вас. Программу возможно скорреткируем, если увидим конкретные хотелки!

Это не курс, здесь не будет никаких нудных и душных лекций. Мы вычеркиваем очень много бесполезной инфы.

Смело задавайте свои вопросы, а мы будем на них отвечать.

Цель буткемпа - как можно скорее запрыгнуть в поезд IT!
14🔥7👏3