Презентация исследователей Университета Саффолка о навыках работы с данными у... библиотекарей [1] и исследователей.
Да, это не ошибка, современная библиотека - это цифровая библиотека, не только с книгами, но и с другими "цифровыми артекфактами" включая данные и о роли Data Librarian я ранее писал. Не все понимают её необходимость, но это только пока ещё.
В исследовательской работе библиотекари данных - это люди умеющие курировать данные, управлять ими и проводить исследования. В некоторых областях деятельности такие роли уже есть, в каких-то появятся позже. А в данной презентации хороший обзор исследований в этой области и предложения по описанию навыков для этой роли.
Ссылки:
[1] https://zenodo.org/record/5155667
#data #dataskills #dataliteracy
Да, это не ошибка, современная библиотека - это цифровая библиотека, не только с книгами, но и с другими "цифровыми артекфактами" включая данные и о роли Data Librarian я ранее писал. Не все понимают её необходимость, но это только пока ещё.
В исследовательской работе библиотекари данных - это люди умеющие курировать данные, управлять ими и проводить исследования. В некоторых областях деятельности такие роли уже есть, в каких-то появятся позже. А в данной презентации хороший обзор исследований в этой области и предложения по описанию навыков для этой роли.
Ссылки:
[1] https://zenodo.org/record/5155667
#data #dataskills #dataliteracy
Для тех кто задумывается что изучать в работе с данными, в Open Data Science пишут [1] про наиболее популярные платформы и навыки в работе с данными. Данные собраны по результатам анализа 18 тысяч вакансий для специалистов по данным.
Обратите внимание:
- главное data infrastructure - это базовое понимание как работать с данными, извлекать, собирать, хранить и тд.
- Python это отраслевой стандарт де-факто. Остальные языки программирования это плюс к нему, но не более того.
- SQL всё ещё необходим и обязателен, а вот NoSQL, к сожалению, хоть и важен, но не на первых местах.
- облачная работа с данными в приоритетах, особено AWS, Azure, Snowflake, Google Cloud
и так далее.
А из продуктов наиболее востребованы специалисты по Spark, Kafka, Airflow и Hadoop.
Правда, я здесь не могу не оговориться о том что жаль что нет такого анализа в разрезе по годам, потому что всё меняется довольно быстро.
Ссылки:
[1] https://opendatascience.com/20-data-engineering-platforms-skills-needed-in-2022/
#data #dataskills
Обратите внимание:
- главное data infrastructure - это базовое понимание как работать с данными, извлекать, собирать, хранить и тд.
- Python это отраслевой стандарт де-факто. Остальные языки программирования это плюс к нему, но не более того.
- SQL всё ещё необходим и обязателен, а вот NoSQL, к сожалению, хоть и важен, но не на первых местах.
- облачная работа с данными в приоритетах, особено AWS, Azure, Snowflake, Google Cloud
и так далее.
А из продуктов наиболее востребованы специалисты по Spark, Kafka, Airflow и Hadoop.
Правда, я здесь не могу не оговориться о том что жаль что нет такого анализа в разрезе по годам, потому что всё меняется довольно быстро.
Ссылки:
[1] https://opendatascience.com/20-data-engineering-platforms-skills-needed-in-2022/
#data #dataskills