На русском от яндекса https://www.coursera.org/specializations/machine-learning-data-analysis
Есть 3 основный типа файла для big data:
💃AVRO
💃PARQUET
💃ORC
Я обычно сразу использую parquet и даже не заморачиваюсь. Но вы можете посмотреть, в чем разница https://blog.clairvoyantsoft.com/big-data-file-formats-3fb659903271
💃AVRO
💃PARQUET
💃ORC
Я обычно сразу использую parquet и даже не заморачиваюсь. Но вы можете посмотреть, в чем разница https://blog.clairvoyantsoft.com/big-data-file-formats-3fb659903271
Medium
Big Data File Formats
In this blog, I will talk about what file formats actually are, go through some common Hadoop file format features, and give a little…
Прямо сейчас начался вебинар - Data Literacy: The New Essential Skill. Возможно узнать, что это такое и попрактиковать английский https://brainstation.io/event/online-event-data-literacy-march2020
Одна из крупных и модных компаний DataRobot начала сокращать персонал, я даже откликался к ним на вакансию AI Solution Architect, но так и ничего не слышал. Но в целом, если посмотреть список компаний, которые увольнают тысячи людей, то они явно что-то знают, что мы не знаем. По Rock Your Data консалтинг, почти все лиды, которые были, сдулись и пропали. А вот Amazon пока держится, даже сток не сильно упал.
BostInno
DataRobot Cuts Workforce as Coronavirus Roils the Startup Economy
The enterprise AI startup has laid off employees globally.
Wow, 90 дней Tableau даёт бесплатный доступ на тренинги. Не важно работаете вы с табло или нет, обязательно пройдите их!
Tableau
Tableau eLearning
Tableau eLearning: Self-paced web-based training for Tableau users. Onboard your team through consistent training using web-based learning modules.
Привет, нм нужно выбрать домен для курсов, вот варианты:
Engineering-analytics.ru
Englytics.ru
Lyeng.ru
Enlytics.ru
Sayyesdata.ru
omydata.ru
Datalearn.ru
Dadabigda.ru
Bigda.ru
Analitika.club
Ну или пишите ваш вариант в комментах. Я хочу сделать основу, и потом добавить ambassadors , кто может более подробно писать инструкции в github в markdown, по сути это будет как ваше портфолио, и можно будет всегда менять содержание учебника.
Engineering-analytics.ru
Englytics.ru
Lyeng.ru
Enlytics.ru
Sayyesdata.ru
omydata.ru
Datalearn.ru
Dadabigda.ru
Bigda.ru
Analitika.club
Ну или пишите ваш вариант в комментах. Я хочу сделать основу, и потом добавить ambassadors , кто может более подробно писать инструкции в github в markdown, по сути это будет как ваше портфолио, и можно будет всегда менять содержание учебника.
datalearn.ru победил! а мне понравился omydata:) В общем приобрел datalearn.ru на 1 год, теперь мы его прикрутим к сайту, который создает Роман (@rspon) на тильде, за что ему спасибо!
Дальше можно будет сделать:
🎥youtube (для видео) GitHub (для текста)
🏖 какой-нибудь веселый лого
🏆сертификат
😎 программу курса прописать (Data Literacy это у нас был introduction), Gentle Data Engineering (это у нас DWH, BI, ETL, ELT, BigData). Тут у меня есть контент и идеи.
💃Analytics for Women, тут сложней, так как я не woman:) Но я хочу быть ментором и найти заинтересованных девушек, кто хочет развивать это русскоговорящие комьюнити (просто идеи с запада взять).
Как я писал нужны добровольцы, кому интересно помочь создать этот ресурс. Самое трудоемкое это создать подробные инструкции на GitHub, такие вот туториал step by step. Зато потом можно в резюме ссылок наставлять😜
Вообще скидывайте идеи, можно также и какие-нибудь курсы в таком формате сделать. Главное идея это что бы был четкий контекст, не просто "строим график и нажимаем кнопки", а зачем график, почему график, почему в Табло, а не в экселе и почему столбчатый график хорошо , а пирог не хорошо, и тп.
Так как я не могу быть экспертом всего, то соответственно где-то я буду срезать углы и округлять. По принципу парето 20% знаний, решать 80% проблем.
Мой личный интерес это масштабировать мою передачу знаний и закрепить ее, я уверен это поможет другим.
Дальше можно будет сделать:
🎥youtube (для видео) GitHub (для текста)
🏖 какой-нибудь веселый лого
🏆сертификат
😎 программу курса прописать (Data Literacy это у нас был introduction), Gentle Data Engineering (это у нас DWH, BI, ETL, ELT, BigData). Тут у меня есть контент и идеи.
💃Analytics for Women, тут сложней, так как я не woman:) Но я хочу быть ментором и найти заинтересованных девушек, кто хочет развивать это русскоговорящие комьюнити (просто идеи с запада взять).
Как я писал нужны добровольцы, кому интересно помочь создать этот ресурс. Самое трудоемкое это создать подробные инструкции на GitHub, такие вот туториал step by step. Зато потом можно в резюме ссылок наставлять😜
Вообще скидывайте идеи, можно также и какие-нибудь курсы в таком формате сделать. Главное идея это что бы был четкий контекст, не просто "строим график и нажимаем кнопки", а зачем график, почему график, почему в Табло, а не в экселе и почему столбчатый график хорошо , а пирог не хорошо, и тп.
Так как я не могу быть экспертом всего, то соответственно где-то я буду срезать углы и округлять. По принципу парето 20% знаний, решать 80% проблем.
Мой личный интерес это масштабировать мою передачу знаний и закрепить ее, я уверен это поможет другим.
А это я с Kent Graziano (который будет выступать на вебинары выше) на kick off Snowflake Vancouver User Group. Он является chief evangelist в Snowflake с начала основания компании. До этого он был Oracle консультантом и блогером, имел статус Oracle Ace Director. На встречи он рассказал как пришел в Snowflake и насколько его поразила способность Snowflake работать с BigData без Hadoop и MapReduce. Просто загружаем ТБ данных и пишем SQL и все работает. Это наверно было 2012-13 год. Все еще активно говорили про Hadoop, о том как он заменит хранилище данных, но в итоге Cloudera и Hortonworks объединились и им это не помогло. Технологии Hadoop отлично послужила, но все ушло вперед. Облако принесло elasticity, контейнеры, и Snowflake использовал преимущества новых технологий и создали революционный продукт.
Как вам подкасты? Вот data science podcast. Я вообще не могу воспринимать такую информацию на слух, мне нужна картинка, ну или текст (лучше с картинками). Из аудио я только послушал книгу Гарри Поттер, когда учил английский, ее озвучил Stephan Fry. Если учите английский, прям очень советую!
А вот для ваших детей, Snowflake книжку раскраску выпустил, маркетинг на уровне! Кстати хорошая идея для бизнеса.
20 апреля мы сделаем бесплатный вебинар с Нетологией, где я расскажу про свой опыт с Data Engineering, устройство на работу за границей и про возможности эммиграции. Регистрируйтесь и приглашайте друзей.
netology.ru
Data Engineering в России и за границей – бесплатный вебинар
Расскажем, как найти работу в сфере данных в России и заграницей и успешно пройти собеседование, а также поделимся историями переквалификации людей с разным опытом в работу с данными.
Смотрите сколько ресурсов:
1. Pluralsight - entire catalog of courses free with #FREEapril: https://lnkd.in/d6fhFsP
2. Tableau eLearning, 90 days free with the code 2020learning - https://lnkd.in/dFDg5jv
3. Qlik's Data Literacy Project eLearning (always free): https://lnkd.in/dr6sPUE
4. edX free course "Analyzing and Visualizing Data with Power BI" - https://lnkd.in/dyKYRM6 (audit path free, $99 for "verified" path)
5. ThoughtSpot U - Free eLearning for Business Users, Business Analysts, Data Experts & Architects: https://lnkd.in/dvcWV8v
6. Looker University - 6 free elearning courses: https://lnkd.in/drrsmVr
1. Pluralsight - entire catalog of courses free with #FREEapril: https://lnkd.in/d6fhFsP
2. Tableau eLearning, 90 days free with the code 2020learning - https://lnkd.in/dFDg5jv
3. Qlik's Data Literacy Project eLearning (always free): https://lnkd.in/dr6sPUE
4. edX free course "Analyzing and Visualizing Data with Power BI" - https://lnkd.in/dyKYRM6 (audit path free, $99 for "verified" path)
5. ThoughtSpot U - Free eLearning for Business Users, Business Analysts, Data Experts & Architects: https://lnkd.in/dvcWV8v
6. Looker University - 6 free elearning courses: https://lnkd.in/drrsmVr
Pluralsight
Pluralsight - The tech workforce development company
Pluralsight helps organizations, teams, and individuals build better products with online courses and data-driven insights that fuel skill development and improve processes.