it пингвин | data engineer

Обзор на курс DE

Итак, прошла половина курса DE от New Professions Lab

Какие лабы еще были сделаны:
Лаба 2 — batch обработка данных e-commerce портала с кликом, аирфлоу и кафкой
Лаба 3 — realtime обработка данных e-commerce портала с кафкой и спарком
Лаба 4 — дата-сервис с фласком, кликом, кафкой (суперачивка - построить дашборд).

Какие еще были лекции:
• Clickhouse
• Hadoop
• Форматы хранения данных
• Введение в Apache Spark
• Apache Spark: оптимизация работы с данными
• Apache Spark Streaming
• Docker. Ansible. Kubernetes
• несколько консультаций

Лекции нравятся. По клику прям очень зашла. Я не знал, что Clickhouse настолько крутая СУБД и так активно везде внедряется. В том же OpenAI анализиуют петабайты данных по логам ежедневно на клике. Капитализация клика оценивается в $6 млрд.

Плотность лекций и лаб достаточно большая, я еще не посмотрел 3 лекции. В целом, лабы выполняю нормально, все что обязательно сделать - сделал, осталось пару суперачивок (необзятальные лабы). Примерно у 70% обучающихся проблем нет, лабы выполняются. Но многим оч тяжело.
Также я активно пользуюсь нейронками, чтобы быстрее выполнить лабы. Но преподы рекомендуют все делать самому без нейронок.

И еще раз хочу подчеркнуть - очень нравится, что есть удаленные машины, на которых выполняем все лабы. Скилл работы с терминалом и настройки окружения прокачивается.

Мне конечно было бы комфортнее, чтоб такой курс длился не 2 месяца, а 3 - 4. Так сейчас у меня очень много дел - напомню, у меня последний месяц испыталки в новой компании (и здесь уже много задач), менторство, тг канал и вот еще такой активный курс. Ну ничего, справимся ✊

Таком промежуточный итог, посмотрим что будет дальше.

it пингвин | data engineer

🐧

Please open Telegram to view this post