Data & IT Career
1.06K subscribers
793 photos
49 videos
14 files
1.35K links
Карьера в дата-профессиях и в ИТ в общем

Tags:
#подборка #survey
#career #зп #CV
#skills
#опросы

По вакансиям: t.iss.one/data_career/1576
Feedback: @black_titmouse

Branched from @data_events
See also @ml_career
tgstat.ru/channel/@data_career/stat/citation
Download Telegram
Data & IT Career
На этой неделе стартовал 5-й поток Лаборатории Apache Spark Advanced – хардкор-программа для middle и senior дата-инженеров от #NewProLab! Подключиться к потоку можно ещё успеть до 7 июля! (Говорят, что это одна из самых глубоких русскоязычных программ…
Собрали ссылки на бесплатные ресурсы, которые будут полезны при подготовке к нашей программе Apache Spark и Scala для дата-инжиниринга

📌Новый поток стартует уже 4 сентября https://newprolab.com/ru/spark-de, а до 30 июля действует промокод DE2023


Для прохождения программы потребуются знания по следующим темам: Scala (желательно, но если вы не знаете Scala, то рекомендуется уверенное знание Python или Java), Apache Spark, Linux, SQL, Kafka, HDFS для формирования витрин данных для последующего анализа, математическая статистика и линейная алгебра.

Ниже — ресурсы по каждой теме. Пожалуйста, готовьтесь до программы, чтобы во время обучения получить максимум новых знаний и не отвлекаться на базовые вещи.

📌Scala
- Базовый туториал по Scala
- Курс на Stepik

📌Apache Spark
- Памятка по Spark в Kubernetes

📌Linux
- курс на CodeAcademy
- курс на Stepik
- курс на edX

📌SQL
- Книга Бен Форта Освой самостоятельно SQL за 10 минут

📌Kafka
- Как работает Kafka в облаке

📌HDFS
- Какие еще есть способы хранения данных и чем S3 лучше HDFS: вебинар

📌Математическая статистика и линейная алгебра
Курсы на Stepik:
- Основы статистики
- Линейная алгебра: методы и задачи

#подборка #free #курсы #spark #scala #sql #linux #hadoop #hdfs #kafka #матстат #linalg #stepic
https://t.iss.one/newprolab_news/149 #NewProLab
🔥2
Прокачиваем свой #датаглоссарий!

#Kafka и архитектура Кафки
Kafka — распределенная платформа обмена сообщениями
• Ассоциация с произведением Ф. Кафки «Превращение»
• Обсуждение параллелей в архитектуре Кафки и мотивах отчуждения

#Shard и принцип "разделяй и властвуй"
• Shard — фрагмент распределенных данных
• В обычном английском переводится как осколок/обломок целого
• Принцип "разделяй и властвуй" в базах данных и в жизни

#Replica и подделки в искусстве
• Replica — копия данных на другом сервере
• Точная подделка произведения искусства или бренда
• Аналогия между репликацией баз данных и проблемами подделок в искусстве

Data pipeline и «Игра престолов»
• Сложные зависимости в data pipeline
• Хитросплетения семейных связей в «Игре престолов»

#Lineage и родословная
• Lineage — история преобразования данных в виде графа
• Родословная, генеалогическое древо

#Подробнее: t.iss.one/rzv_de/266 #датаглоссарий #глоссарий
#DataPipeline
👍2