Я – Дата Инженер
4.33K subscribers
343 photos
33 videos
12 files
242 links
💻 Как войти в IT?
💵 Как стать Data Engineer
🗄 Что такое Big Data и кто ей управляет?
_____________________________
Автор @halltape
Все вопросы по рекламе @k_shredinger
Download Telegram
🔴 ROADMAP V2.0 для Data Engineer!

Наш BootCamp 2 месяца и выходишь на работу!
➡️ roadmappers.ru

Как стать Дата Инженером?
Мы создали БЕСПЛАТНЫЙ ROADMAP для Data Engineer!

➡️ ROADMAP для Data Engineer!

Что внутри?
0. Деньги
1. Кто такой Дата Инженер?
2. Python/SQL
3. Github/Git
4. Linux/Terminal
5. DWH
6. Нормальные формы
7. Модели данных
8. Data Vault
9. Индексы и партиции
10. Docker
11. Hadoop
12. Airflow
13. Greenplum
14. Clickhouse
15. Spark
16. dbt
17. Kafka
18. Pet Project
19. Вопросы с собесов
20. Резюме и Работа
21. Рабочие кейсы
22. Полезные ссылки


🖥 Наш чат для общения

📺 Кто я и как попал в IT?
СМОТРИ интервью со мной!

📺 Смотри подкаст про IT "За Пределами Кода"

Авторы Roadmap:
Евгений Виндюков
😀 Telegram канал
📺 Youtube канал

Владимир Шустиков
💬 Telegram канал
📺 Youtube канал

Алексей Разводов
💬 Telegram канал
📺 Youtube канал
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥158👍2317👏5
📣 Завтра СТРИМ в 20:00 мск?
Anonymous Poll
50%
Приду
50%
Не смогу быть
🔥12👍3👏21
🔴 Ссылка на СТРИМ

https://www.twitch.tv/halltape

Вопросы и все остальное пишите в на Twitch!

ВОПРОСЫ И ОБСУЖДЕНИЕ рекомендую на TWITCH!
https://www.twitch.tv/halltape
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Даже он стал Дата Инженером, а ты?

➡️ Как стать Data Engineer?
Please open Telegram to view this post
VIEW IN TELEGRAM
😁39🔥213👍2
😂 100 метровое название у таблицы!

Рассказываю простой, но интересный кейс на работе, а самое главное понятный для всех!

Читаю данные из хранилища S3 при помощи Spark и складываю таблички в Greenplum. Все работает четко и быстро. Но вдруг на двух таблицах код начинает падать. Захожу в логи – там пишут:
"Мы не можем создать таблицу в Гринплам с названием
schema.do_you_speak_british_english_or

потому что в Spark у вас
schema.do_you_speak_british_english_or_american_english

Короче, я смотрю и не понимаю. Почему он обрезал часть названия. Все же было нормально, АЛЕ! Справедливо сказать, что названия были конечно намного длиннее и адекватнее. Просто показываю картину, которую я увидел.
Оказалось, что Гринплам не может записывать к себе названия таблиц/колонок, длина которых более 63 символов. Надо резать хвост.

А как, если у меня таких 100 таблиц и в каждой есть разный набор очень длинных названий столбцов. По какому принципу мне резать? Названия могут содержать в себе важную инфу и не всегда можно написать одинаковый паттерн для всех.

В итоге я конечно внес правки в Спарк код, чтобы он буквально два столбца переименовывал. Остальные были ок.
Но осадочек остался, если вы понимаете о чем... лично я нет.

В целом ситуация чисто на один раз. Всегда можно подправить на стадии трансформации. Просто неудобно, когда это в рамках простой миграции таблиц, где используется один общий для всех код.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍194🔥3😁1
😘 Все, кто скачал Юбуст, удаляйте расширение. У меня нет гарантий, что эта штука не в руках мошенников!

Причины и последствия мне неизвестны. Сейчас никому нельзя доверять.

Лично я удалил Юбуст и скорее всего сделаю собственное решение, в котором буду полностью уверен. Импортозаместим импортозамещение.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱10🤔5🤯4👍2
Разбираем тестовое задание на позицию Junior Аналитика в Яндекс

Чтобы найти работу, мало пройти курс и сделать классное резюме. На практике, чтобы выделиться на собеседовании, нужно понимать, что лежит под капотом каждого инструмента, а не следовать конкретному заученному алгоритму.

Чтобы попрактиковаться в этом, приходите на бесплатный вебинар, где будем разбирать реальное тестовое задание, которое дают аналитикам в подразделении Яндекс Картинки.

Что будет на вебинаре:
🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла
🟠Найдём закономерности и отличия использования сервиса на мобильных устройствах и компьютерах
🟠Разберём фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.

Вебинар проведет Андрон Алексанян, CEO Simulative
🕗Встречаемся 24 декабря в 19:00

🎁Обязательно приходите смотреть вебинар в прямом эфире - в лайве будут дарить подарки, которые сильно бустанут старт карьеры в аналитике!

Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👍132🔥1
⛔️ Старше 30? Забудь про IT

Выдохните! Ничего не поздно. Мне 31. Я вкатился в IT в 29 лет. И отлично себя чувствую (прямо как на картинке).

Да, у меня тоже был страх, что сейчас мне будут отказывать в возрасте и я никогда не получу уже работу программистом и не буду зарабатывать 300к/наносекунду. Это вообще в реальности не так.

Во первых для борьбы с этим страхом вы убираете графу возраст в резюме. Пусть с той стороны гадают сколько вам лет.

Во вторых у меня было несколько собеседований, где собеседующие были старше меня по возрасту. В IT все стареют, даже эти вчерашние школьники. Сфера стареет вместе с людьми.

В третьих не обращайте внимание на умников, которые говорят, что программирование надо изучать с 14 лет минимум! А если с 17 лет начали – то это поздно уже. Это бред. Взяли книжку, степик, литкод и за год научились писать на этом скл, питоне и спарке. Рынку не требуются академики. Рынку требуются стандартные спецы, которые будут решать типовые задачи. Забудьте про олимпиады, опен сорс и стартапы. Это все влажные фантазии вокруг историй успеха от Стива Джобса, Марка Цукерберга и Павла Дурова. Вы простой работник, как и мендежер в офисе. Просто вам разрешена удаленка и нет дресс кода.

Думаю, что ТРИ аргумента вам будет достаточно, чтобы забыть про возраст.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5722
🎄 СТРИМ 30 декабря в 20:00 мск

Инженерообязанный
Я – Дата Инженер

Про что стрим?

1. Как вкатываться в IT в 25 году?

2. Бомбим на тех, кто считает что вкатываться уже поздно

3. Поговорим про VK и Rutube

А также мы написали своего Telegram бота, с которым вы снова сможете смотреть YouTube и не только! Ключи от него раздадим на стриме!

P.S. Записи не будет
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥73
🔴 Ссылка на СТРИМ

https://www.twitch.tv/halltape

Запись стрима будет доступна 7 дней - https://www.twitch.tv/videos/2339889477

Вопросы и все остальное пишите в на Twitch!

ВОПРОСЫ И ОБСУЖДЕНИЕ рекомендую на TWITCH!
https://www.twitch.tv/halltape
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍2
Итоги 2024:
1. RoadmapDE - так станешь Дата Инженером
2. VPN - так сможешь смотреть YouTube

Желаю лутать больше денег, меньше работать и больше отдыхать!
👍37🔥17👏2😁2
Apache Spark для Джуна | Что такое Spark и как он работает?

😘 Смотреть Spark на YouTube

🇷🇺 VPN для просмотра ЗАМЕДЛЕННОГО YouTube

Посмотрите, пожалуйста, на Youtube - для этого у вас есть наш VPN бот с бесплатным доступом к ЗАМЕДЛЕННОМУ youtube. В свое время мне очень не хватало такого видоса про Spark, поэтому я сделал свой.

Более того, в описании есть даже подготовленный мною репозиторий в докере.

➡️ https://github.com/halltape/HalltapeSparkCluster

Можно развернуть у себя небольшой кластер и поиграться с данными, как будто вы на реальной работе. Для этого выбирайте Spark Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥329👍5
🔵 Че такое деплой?

По традиции для бабушек, поделюсь, как работает наш БЕСПЛАТНЫЙ VPNBot, который позволяет смотреть Youtube без регистрации и СМС!

Телеграм бот написан на python + aiogram (библиотека для телеграма). Код бота хранится в закрытом github репозитории. А программа бота запущена на сервере в Нидерландах. Как его туда доставить? Например Почтой России…

первый вариант (для очень новичков)
Написали код, сделали git push в свой репозиторий. Потом зашли сами вручную на сервер и сделали git pull. Ну т.е. скачали папку и потом вручную нажали кнопку PLAY. Если вы не знакомы с docker, то скорее вы сделали python main.py. И скорее всего все пароли, токены для бота и прочие секреты у вас хранятся открыто в коде. Все равно, что данные карты хранить на видном месте.

второй вариант (бест практис). Во-первых у себя на компе вы собираете докер-контейнер. Его можно запускать с авто-рестартом, что очень удобно. Если упал, значит перезапуститься сам. Все пароли и секреты вы закидываете в файл .env. Его сразу надо закинуть в .gitignore, чтобы при git push он НЕ загружался на GitHub. Этот файлик нужен вам на локальном компе, чтобы вы могли тестировать свою программу. Кстати файлик .env должен быть и на удаленном сервере, но как он туда попадет, если в github мы его не загружаем?

В Github есть github secrets, куда можно записать все секреты, типа как SSH ключ! А теперь самое главное:

Дальше нужно написать файлик с расширением .yml, в котором будет инструкция, как собирать ваш проект, куда и на какой сервер отправлять собранный проект и даже как запускать. Очевидно, что в github secrets надо еще добавить логины и пароли для подключения к серверу.

Вот, как это выглядит. Мы загрузили код на github, тут же включается github actions (это функционал самого github), который читает файлик .yml. В этом файлике можно прописать инструкцию, как и из чего собрать файлик .env. А он его собирает из тех секретов, который мы ранее уже указали. Дальше github actions подключается к удаленному серверу и просто пересылает собранный проект и запускает его.

На самом деле можно прописать еще всякие проверки на синтаксис и тесты. И таким образом, при каждом git push, ваш код будет автоматически собираться, отправляться на сервер и сам запускаться. Опять же, так сейчас работает наш VPNBot. По факту, приколов можно придумать еще больше!
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍10🔥4😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Мысли все бросить!

АРХИВ. Видео от 2022 года. Во время обучения в Школе21 меня посещали мысли все бросить и забить на эти компуктеры. Было сложно, непонятно.. а это между прочим было обучение на языке Си! Там надо о памяти компа думать, а не вот эти ваши джавы и питоны со сборщиками мусора! ЭТО БАЗА!

Вполне возможно, что у вас сейчас такой же период, когда ничего непонятно, страх перед просто огромным списком технологий, которые надо знать. Особенно, когда вы смотрите на наш Roadmap DE. Согласен, требований много.. Но учитывайте, что не во всех компаниях и командах у вас будет даже 80% стека из роадмапа. Да и на Джуна вам нужно знать все на поверхностном уровне.

Я не сдался. Хоть мне и сигналили таксисты. Хоть вокруг в школе21 были люди, кто шарят лучше и быстрее. В итоге я заработал свой первый миллион долларов уже на следующий.. ладно, проехали.

Короче. Вот вам мотивация. Будете ничего не делать, останетесь в заднице. Все наши каналы дают достаточно инфы, чтобы залететь и через 9 месяцев родить себя в роли Дата Инженера. И больше прагматичности. Ваша жизнь только в ваших руках. Ни один умник, который топит ЗА БАЗУ не будет вам помогать деньгами, если вы себя продадите за копейки.

Выжимайте максимум из бизнеса, потому что он хочет выжить из вас все! Вы разменная монета. Сегодня вы нужны, завтра нет.

Но зато я не уволю вас из своего канала. Только если вы сами уволитесь.. потому что что?

МЫ СЕМЬЯ! МЫ КОМАНДА!
нет
👍43🔥2519😁2
⚠️ Интернет - ВСЕ!

У меня работает только телега. Все остальное сломалось. Мегафон мобильный не работает. Wi Fi Телинком тоже.

У кого как?

UPDATE: Вроде очухался. Но я уже приготовился читать книгу. А все, возвращаюсь к просмотру ШОРТС.


UPDATE v2: Просто баланс ушел в минус, надо было денег закинуть. Вот закинули!
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯25😁21🤔2👏1
Мечтаете о работе в крупной международной компании?

Рекрутеры не скрывают, что лишь 25–30% вакансий доступны публично 🥺

Как же быть, если вы стремитесь к карьере в ведущих компаниях Европы, ОАЭ, Великобритании и MENA?

Шаг 1
Прямо сейчас подпишитесь на канал CareerPump от Александра Лепешкина. Здесь вы узнаете о самых актуальных обновлениях на международном рынке труда. А также Александр расскажет о том, как искать работу без рассылок резюме.

Шаг 2
Не пропустите старт февральского потока курса LinkedInPUMP 2025:

Переупакуете свой профиль в LinkedIn - > чтобы рекрутеры находили вас сами;
Расширите свою профессиональную сеть контактов;
Научитесь писать посты, которые собирают 120К+ просмотров;

Не упустите шанс получить оффер на работу мечты в Европе ❤️
Собирайте чемоданы, пока читаете подробности на канале CareerPump от Александра Лепешкина.
😁12🔥93👍3👏3
Я.Собес

Кстати я один раз был у них на собесе. Но завалил первый же этап по алгосам. Ну и собственно и не готовился по ним. Пока желания туда идти нет)

Вроде они убрали все эти сто тыщ этапов до трех. Но не проверял)
😁53🔥2🤔2
Станьте инженером данных с нуля за 5 месяцев, обучаясь на реальных задачах бизнеса.

Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учился складывать 2+2, а на работе – сразу отправляют считать интегралы.

Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: например, вы будете формировать продуктовые рекомендации для клиентов крупного телекома с помощью Clickhouse.

Обучение охватывает весь стек, который нужен специалисту: SQL, Python, Metabse, Linux, Docker, Airflow, Clickhouse, Hadoop и Spark. А также готовит к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое.

С трудоустройством поможем, а на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу.

Еще успеваете записаться в текущий поток.
По промокоду HALLTAPE дарим скидку 12%
😁12😱9🔥52👍1
💫 Не крутил, не мужик!

История про накрутку опыта. Увидел где-то в чатах телеги.

У меня на работе недавно была история. Взяли паренька тестировщиком, он прошел тех собес, фидбэк положительный, сказал что у него 2 года опыта, в резюме компании написаны. Приняли в общем. Уже когда вышел на первой неделе стали возникать серьезные вопросы к его производительности - прям какие-то элементарные вещи не знал, рп стал переживать а как так и тд, пошел к hr. Hr только тогда подняли его трудовую, в которой единственная запись - Артист балета. Спросили у него как так? Говорит работал по ип. Позвонили в те компании, которые он указывал - там сказали, что его не знают. Попросили доки у него для подтверждения работы- не дал. Уволили короче через 5 дней после выхода. Насколько я знаю за 18 лет компании на рынке это первый раз когда чекали чей-то опыт и то только потому что прям вообще никак не справлялся


В этой истории один вопрос:
Как он прошел тех собес?

Спрашивайте за рабочие кейсы и желательно за те задачи, которые у вас сейчас на проекте. Ведь человек будет делать эти таски. В эту дыру будут пролазить всегда, пока она открыта.

P.S. у меня сейчас марафон рекламы. Потерпите, плиз, готовлю класный контент на ютубе! А это стоит 💲
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25😁13🔥5👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Начни год с новой главы в своей карьере!

Уже есть опыт работы с хранилищами данных, но хочешь прокачать скилы и открыть новые карьерные горизонты? Приглашаем на ИТ-интенсив в Открытые школы Т1!

За месяц ты бесплатно получишь новые знания, практический опыт и шанс продолжить карьеру в крупнейшей российской ИТ-компании Т1!*

А также:

🧩 бесплатное обучение в гибком формате: по вечерам, онлайн, из любого города РФ и РБ;

🧩 материалы от HR для прокачки резюме и подготовки к интервью в Т1;

🧩 знакомство с ИТ-командой, погружение в культуру, проекты и процессы;

🧩 поддержка опытных преподавателей и карьерный фаст-трек до мидла в Т1 для выпускников;

🧩 реальный шанс получить оффер в Т1 и работать в аккредитованной ИТ-компании с современным техстеком и классными бонусами: ДМС, удаленка и крутые офисы, спорт и обучение, митапы и ИТ-конференции, программы признания и развития для твоего роста.

Сделай первый шаг в будущее — подай заявку до 10.02!

*По выручке, по версии RAEX и CNews Analytics 2023.

Реклама. «ООО «ГК «Иннотех»» ИНН:
9703073496. Erid: 2SDnjc4GQFv
🔥12👍2👏21😁1