Я – Дата Инженер
4.33K subscribers
343 photos
33 videos
12 files
242 links
💻 Как войти в IT?
💵 Как стать Data Engineer
🗄 Что такое Big Data и кто ей управляет?
_____________________________
Автор @halltape
Все вопросы по рекламе @k_shredinger
Download Telegram
Топ вопросов на собеседовании по SQL- Часть 3

Топовая 3 часть, подоспела к вам ребзя. В ней я решил не просто сделать презентацию😊, а сделать небольшой интерактивчик😎, так что если захочешь потыкаться, все ссылки ниже👇.

В следующей части продолжим говорить о теоритически-практических вопросах собеседования, которые не привязать к определённым темам, поэтому будет "сборная солянка". 🥘 Ммммм....

Если у тебя уже есть блок вопросов, которые тебе задавали и ты их не услышал, пиши в комментариях. Ответ обязательно добавлю в следующих видео, тем самым ты поможешь не только себе, но и другим ребятам, которые вкатываются в IT.🆘

Ну тут уже можно сказать, что SQL часть собеседования ты прошёл на 5️⃣.

😘 Ссылка на видео.
😵 Презентация.
🔙 Блокнот по вопросам NULL.
🔙 Блокнот по агрегационным вопросам.

Не забывайте и про другие части🧑‍🎓:

😘 Часть 1.
😘 Часть 2.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥213👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🧐 HADOOP ВСЁ?

Года два назад, когда я не сильно понимал, что такое Hadoop и HDFS, я тоже задавался вопросом:
"Почему в чатах пишут, что хадуп умер?"

Да, технологии конечно меняются, правда и сам Hadoop обновляется (уже версия 3.4.0), но важно понимать, что огромная часть данных уже загружена на сервера с HDFS и просто взять и за день сменить тип хранилища уже не получится.

Собственно для тех, кто боится, что изучив сейчас хадуп, он потом не понадобится, есть видос с Hadoop Admins Meetup. Это те же разговоры, что Java умерла, что php умер. Ну сколько кода уже написано.. Во-первых кто его будет переписывать на новый стек?

Короче говоря, Хадупы и его друзья умрут в тот момент, когда их труп уже разложится. А до этого момента нам еще надо дожить..
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19🔥43
🗞 IT – это скам!

Ждем, когда Мелстрой начнет стримить сборку docker-compose 😂

Кол-во неверующих людей конечно зашкаливает. Придумывают любые причины, лишь бы лениться и не учиться... Потом они вам будут говорить, что в IT уже все, поезд ушел. Не слушайте тех, кто закатился в IT 10-15 лет назад и тех, кто так и не смог. Вам нужно брать модель поведения от свежих ребят, которые залетели условно вчера. Эти ребята шарят за рынок и за современные реалии.

Вы же не прислушиваетесь к советам бабушки, которая очевидно вообще не шарит за это..

Не в обиду опытным людям, но вы уже со стороны работодателя
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍7🔥3😁2
📣 Есть предложение провести сегодня стрим в 16:00?
Anonymous Poll
32%
Приду
59%
Не смогу быть
9%
Другое(комменты)
🔴 Ссылка на СТРИМ

https://www.twitch.tv/halltape

Сегодня будем обсуждать проблему накрутки опыта. Бороться с ней или нет.. И как быть

Вопросы и все остальное пишите в на Twitch!

ВОПРОСЫ И ОБСУЖДЕНИЕ рекомендую на TWITCH!
https://www.twitch.tv/halltape
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
Станьте инженером данных с нуля за 5 месяцев, обучаясь на реальных задачах бизнеса.

Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учился складывать 2+2, а на работе – сразу отправляют считать интегралы.

Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: например, вы будете формировать продуктовые рекомендации для клиентов крупного телекома с помощью Clickhouse.

Обучение охватывает весь стек, который нужен специалисту: SQL, Python, Metabse, Linux, Docker, Airflow, Clickhouse, Hadoop и Spark. А также готовит к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое.

С трудоустройством поможем, а на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу.

Еще успеваете записаться в текущий поток
По промокоду HALLTAPE дарим скидку 12%
🔥13😁8👍3👏3
This media is not supported in your browser
VIEW IN TELEGRAM
🎄🎄🎄🎄🎄🎄🎄
🔡🔡🔡🔡🔡🔡🔡

Бу, испугался? Не бойся, ROADMAP V2.0 уже завтра!

Завтра 13 декабря (Пятница) я выложу Roadmap V2.0 - Как стать Дата Инженером!

Только самое необходимое, чтобы у вас больше не возникало вопросов типа:
1. А сколько просить денег?

2. А насколько надо знать Hadoop?

3. А что писать в резюме?

и так далее


Короче после этого роадмапа вы точно залетите в IT и начнете лутать кучу денег!
А мой канал будет постоянно вам подкидывать мощнейшую мотивацию.

Мотивацию надо поднять! Поднять надо мотивацию!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥111👍10😁42
🔴 ROADMAP V2.0 для Data Engineer!

Наш BootCamp 2 месяца и выходишь на работу!
➡️ roadmappers.ru

Как стать Дата Инженером?
Мы создали БЕСПЛАТНЫЙ ROADMAP для Data Engineer!

➡️ ROADMAP для Data Engineer!

Что внутри?
0. Деньги
1. Кто такой Дата Инженер?
2. Python/SQL
3. Github/Git
4. Linux/Terminal
5. DWH
6. Нормальные формы
7. Модели данных
8. Data Vault
9. Индексы и партиции
10. Docker
11. Hadoop
12. Airflow
13. Greenplum
14. Clickhouse
15. Spark
16. dbt
17. Kafka
18. Pet Project
19. Вопросы с собесов
20. Резюме и Работа
21. Рабочие кейсы
22. Полезные ссылки


🖥 Наш чат для общения

📺 Кто я и как попал в IT?
СМОТРИ интервью со мной!

📺 Смотри подкаст про IT "За Пределами Кода"

Авторы Roadmap:
Евгений Виндюков
😀 Telegram канал
📺 Youtube канал

Владимир Шустиков
💬 Telegram канал
📺 Youtube канал

Алексей Разводов
💬 Telegram канал
📺 Youtube канал
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥158👍2317👏5
📣 Завтра СТРИМ в 20:00 мск?
Anonymous Poll
50%
Приду
50%
Не смогу быть
🔥12👍3👏21
🔴 Ссылка на СТРИМ

https://www.twitch.tv/halltape

Вопросы и все остальное пишите в на Twitch!

ВОПРОСЫ И ОБСУЖДЕНИЕ рекомендую на TWITCH!
https://www.twitch.tv/halltape
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Даже он стал Дата Инженером, а ты?

➡️ Как стать Data Engineer?
Please open Telegram to view this post
VIEW IN TELEGRAM
😁39🔥213👍2
😂 100 метровое название у таблицы!

Рассказываю простой, но интересный кейс на работе, а самое главное понятный для всех!

Читаю данные из хранилища S3 при помощи Spark и складываю таблички в Greenplum. Все работает четко и быстро. Но вдруг на двух таблицах код начинает падать. Захожу в логи – там пишут:
"Мы не можем создать таблицу в Гринплам с названием
schema.do_you_speak_british_english_or

потому что в Spark у вас
schema.do_you_speak_british_english_or_american_english

Короче, я смотрю и не понимаю. Почему он обрезал часть названия. Все же было нормально, АЛЕ! Справедливо сказать, что названия были конечно намного длиннее и адекватнее. Просто показываю картину, которую я увидел.
Оказалось, что Гринплам не может записывать к себе названия таблиц/колонок, длина которых более 63 символов. Надо резать хвост.

А как, если у меня таких 100 таблиц и в каждой есть разный набор очень длинных названий столбцов. По какому принципу мне резать? Названия могут содержать в себе важную инфу и не всегда можно написать одинаковый паттерн для всех.

В итоге я конечно внес правки в Спарк код, чтобы он буквально два столбца переименовывал. Остальные были ок.
Но осадочек остался, если вы понимаете о чем... лично я нет.

В целом ситуация чисто на один раз. Всегда можно подправить на стадии трансформации. Просто неудобно, когда это в рамках простой миграции таблиц, где используется один общий для всех код.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍194🔥3😁1
😘 Все, кто скачал Юбуст, удаляйте расширение. У меня нет гарантий, что эта штука не в руках мошенников!

Причины и последствия мне неизвестны. Сейчас никому нельзя доверять.

Лично я удалил Юбуст и скорее всего сделаю собственное решение, в котором буду полностью уверен. Импортозаместим импортозамещение.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱10🤔5🤯4👍2
Разбираем тестовое задание на позицию Junior Аналитика в Яндекс

Чтобы найти работу, мало пройти курс и сделать классное резюме. На практике, чтобы выделиться на собеседовании, нужно понимать, что лежит под капотом каждого инструмента, а не следовать конкретному заученному алгоритму.

Чтобы попрактиковаться в этом, приходите на бесплатный вебинар, где будем разбирать реальное тестовое задание, которое дают аналитикам в подразделении Яндекс Картинки.

Что будет на вебинаре:
🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла
🟠Найдём закономерности и отличия использования сервиса на мобильных устройствах и компьютерах
🟠Разберём фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.

Вебинар проведет Андрон Алексанян, CEO Simulative
🕗Встречаемся 24 декабря в 19:00

🎁Обязательно приходите смотреть вебинар в прямом эфире - в лайве будут дарить подарки, которые сильно бустанут старт карьеры в аналитике!

Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👍132🔥1
⛔️ Старше 30? Забудь про IT

Выдохните! Ничего не поздно. Мне 31. Я вкатился в IT в 29 лет. И отлично себя чувствую (прямо как на картинке).

Да, у меня тоже был страх, что сейчас мне будут отказывать в возрасте и я никогда не получу уже работу программистом и не буду зарабатывать 300к/наносекунду. Это вообще в реальности не так.

Во первых для борьбы с этим страхом вы убираете графу возраст в резюме. Пусть с той стороны гадают сколько вам лет.

Во вторых у меня было несколько собеседований, где собеседующие были старше меня по возрасту. В IT все стареют, даже эти вчерашние школьники. Сфера стареет вместе с людьми.

В третьих не обращайте внимание на умников, которые говорят, что программирование надо изучать с 14 лет минимум! А если с 17 лет начали – то это поздно уже. Это бред. Взяли книжку, степик, литкод и за год научились писать на этом скл, питоне и спарке. Рынку не требуются академики. Рынку требуются стандартные спецы, которые будут решать типовые задачи. Забудьте про олимпиады, опен сорс и стартапы. Это все влажные фантазии вокруг историй успеха от Стива Джобса, Марка Цукерберга и Павла Дурова. Вы простой работник, как и мендежер в офисе. Просто вам разрешена удаленка и нет дресс кода.

Думаю, что ТРИ аргумента вам будет достаточно, чтобы забыть про возраст.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5722
🎄 СТРИМ 30 декабря в 20:00 мск

Инженерообязанный
Я – Дата Инженер

Про что стрим?

1. Как вкатываться в IT в 25 году?

2. Бомбим на тех, кто считает что вкатываться уже поздно

3. Поговорим про VK и Rutube

А также мы написали своего Telegram бота, с которым вы снова сможете смотреть YouTube и не только! Ключи от него раздадим на стриме!

P.S. Записи не будет
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥73
🔴 Ссылка на СТРИМ

https://www.twitch.tv/halltape

Запись стрима будет доступна 7 дней - https://www.twitch.tv/videos/2339889477

Вопросы и все остальное пишите в на Twitch!

ВОПРОСЫ И ОБСУЖДЕНИЕ рекомендую на TWITCH!
https://www.twitch.tv/halltape
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍2
Итоги 2024:
1. RoadmapDE - так станешь Дата Инженером
2. VPN - так сможешь смотреть YouTube

Желаю лутать больше денег, меньше работать и больше отдыхать!
👍37🔥17👏2😁2
Apache Spark для Джуна | Что такое Spark и как он работает?

😘 Смотреть Spark на YouTube

🇷🇺 VPN для просмотра ЗАМЕДЛЕННОГО YouTube

Посмотрите, пожалуйста, на Youtube - для этого у вас есть наш VPN бот с бесплатным доступом к ЗАМЕДЛЕННОМУ youtube. В свое время мне очень не хватало такого видоса про Spark, поэтому я сделал свой.

Более того, в описании есть даже подготовленный мною репозиторий в докере.

➡️ https://github.com/halltape/HalltapeSparkCluster

Можно развернуть у себя небольшой кластер и поиграться с данными, как будто вы на реальной работе. Для этого выбирайте Spark Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥329👍5
🔵 Че такое деплой?

По традиции для бабушек, поделюсь, как работает наш БЕСПЛАТНЫЙ VPNBot, который позволяет смотреть Youtube без регистрации и СМС!

Телеграм бот написан на python + aiogram (библиотека для телеграма). Код бота хранится в закрытом github репозитории. А программа бота запущена на сервере в Нидерландах. Как его туда доставить? Например Почтой России…

первый вариант (для очень новичков)
Написали код, сделали git push в свой репозиторий. Потом зашли сами вручную на сервер и сделали git pull. Ну т.е. скачали папку и потом вручную нажали кнопку PLAY. Если вы не знакомы с docker, то скорее вы сделали python main.py. И скорее всего все пароли, токены для бота и прочие секреты у вас хранятся открыто в коде. Все равно, что данные карты хранить на видном месте.

второй вариант (бест практис). Во-первых у себя на компе вы собираете докер-контейнер. Его можно запускать с авто-рестартом, что очень удобно. Если упал, значит перезапуститься сам. Все пароли и секреты вы закидываете в файл .env. Его сразу надо закинуть в .gitignore, чтобы при git push он НЕ загружался на GitHub. Этот файлик нужен вам на локальном компе, чтобы вы могли тестировать свою программу. Кстати файлик .env должен быть и на удаленном сервере, но как он туда попадет, если в github мы его не загружаем?

В Github есть github secrets, куда можно записать все секреты, типа как SSH ключ! А теперь самое главное:

Дальше нужно написать файлик с расширением .yml, в котором будет инструкция, как собирать ваш проект, куда и на какой сервер отправлять собранный проект и даже как запускать. Очевидно, что в github secrets надо еще добавить логины и пароли для подключения к серверу.

Вот, как это выглядит. Мы загрузили код на github, тут же включается github actions (это функционал самого github), который читает файлик .yml. В этом файлике можно прописать инструкцию, как и из чего собрать файлик .env. А он его собирает из тех секретов, который мы ранее уже указали. Дальше github actions подключается к удаленному серверу и просто пересылает собранный проект и запускает его.

На самом деле можно прописать еще всякие проверки на синтаксис и тесты. И таким образом, при каждом git push, ваш код будет автоматически собираться, отправляться на сервер и сам запускаться. Опять же, так сейчас работает наш VPNBot. По факту, приколов можно придумать еще больше!
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍10🔥4😱1