Data & IT Career
Собрали ссылки на бесплатные ресурсы, которые будут полезны при подготовке к нашей программе Apache Spark и Scala для дата-инжиниринга
📌Новый поток стартует уже 4 сентября https://newprolab.com/ru/spark-de, а до 30 июля действует промокод DE2023
Для прохождения программы потребуются знания по следующим темам: Scala (желательно, но если вы не знаете Scala, то рекомендуется уверенное знание Python или Java), Apache Spark, Linux, SQL, Kafka, HDFS для формирования витрин данных для последующего анализа, математическая статистика и линейная алгебра.
Ниже — ресурсы по каждой теме. Пожалуйста, готовьтесь до программы, чтобы во время обучения получить максимум новых знаний и не отвлекаться на базовые вещи.
📌Scala
- Базовый туториал по Scala
- Курс на Stepik
📌Apache Spark
- Памятка по Spark в Kubernetes
📌Linux
- курс на CodeAcademy
- курс на Stepik
- курс на edX
📌SQL
- Книга Бен Форта Освой самостоятельно SQL за 10 минут
📌Kafka
- Как работает Kafka в облаке
📌HDFS
- Какие еще есть способы хранения данных и чем S3 лучше HDFS: вебинар
📌Математическая статистика и линейная алгебра
Курсы на Stepik:
- Основы статистики
- Линейная алгебра: методы и задачи
#подборка #free #курсы #spark #scala #sql #linux #hadoop #hdfs #kafka #матстат #linalg #stepic
https://t.iss.one/newprolab_news/149 #NewProLab
📌Новый поток стартует уже 4 сентября https://newprolab.com/ru/spark-de, а до 30 июля действует промокод DE2023
Для прохождения программы потребуются знания по следующим темам: Scala (желательно, но если вы не знаете Scala, то рекомендуется уверенное знание Python или Java), Apache Spark, Linux, SQL, Kafka, HDFS для формирования витрин данных для последующего анализа, математическая статистика и линейная алгебра.
Ниже — ресурсы по каждой теме. Пожалуйста, готовьтесь до программы, чтобы во время обучения получить максимум новых знаний и не отвлекаться на базовые вещи.
📌Scala
- Базовый туториал по Scala
- Курс на Stepik
📌Apache Spark
- Памятка по Spark в Kubernetes
📌Linux
- курс на CodeAcademy
- курс на Stepik
- курс на edX
📌SQL
- Книга Бен Форта Освой самостоятельно SQL за 10 минут
📌Kafka
- Как работает Kafka в облаке
📌HDFS
- Какие еще есть способы хранения данных и чем S3 лучше HDFS: вебинар
📌Математическая статистика и линейная алгебра
Курсы на Stepik:
- Основы статистики
- Линейная алгебра: методы и задачи
#подборка #free #курсы #spark #scala #sql #linux #hadoop #hdfs #kafka #матстат #linalg #stepic
https://t.iss.one/newprolab_news/149 #NewProLab
🔥2
Прокачиваем свой #датаглоссарий!
#Kafka и архитектура Кафки
• Kafka — распределенная платформа обмена сообщениями
• Ассоциация с произведением Ф. Кафки «Превращение»
• Обсуждение параллелей в архитектуре Кафки и мотивах отчуждения
#Shard и принцип "разделяй и властвуй"
• Shard — фрагмент распределенных данных
• В обычном английском переводится как осколок/обломок целого
• Принцип "разделяй и властвуй" в базах данных и в жизни
#Replica и подделки в искусстве
• Replica — копия данных на другом сервере
• Точная подделка произведения искусства или бренда
• Аналогия между репликацией баз данных и проблемами подделок в искусстве
Data pipeline и «Игра престолов»
• Сложные зависимости в data pipeline
• Хитросплетения семейных связей в «Игре престолов»
#Lineage и родословная
• Lineage — история преобразования данных в виде графа
• Родословная, генеалогическое древо
#Подробнее: t.iss.one/rzv_de/266 #датаглоссарий #глоссарий
#DataPipeline
#Kafka и архитектура Кафки
• Kafka — распределенная платформа обмена сообщениями
• Ассоциация с произведением Ф. Кафки «Превращение»
• Обсуждение параллелей в архитектуре Кафки и мотивах отчуждения
#Shard и принцип "разделяй и властвуй"
• Shard — фрагмент распределенных данных
• В обычном английском переводится как осколок/обломок целого
• Принцип "разделяй и властвуй" в базах данных и в жизни
#Replica и подделки в искусстве
• Replica — копия данных на другом сервере
• Точная подделка произведения искусства или бренда
• Аналогия между репликацией баз данных и проблемами подделок в искусстве
Data pipeline и «Игра престолов»
• Сложные зависимости в data pipeline
• Хитросплетения семейных связей в «Игре престолов»
#Lineage и родословная
• Lineage — история преобразования данных в виде графа
• Родословная, генеалогическое древо
#Подробнее: t.iss.one/rzv_de/266 #датаглоссарий #глоссарий
#DataPipeline
👍2