Инжиниринг Данных
23.5K subscribers
1.99K photos
55 videos
193 files
3.21K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
А вот информация по следующему вебинары, который уже будет в четверг (сегодня) в 7 часов вечера по Москве - “ВЫВОДЫ ЗА 10 ЛЕТ РАЗВИТИЯ ПРАКТИКИ QLIK “. Мы познакомились со спикером через мою статью про консалтинг компанию, но в отличие от моего опыта, дела у него обстоят хорошо, о чем он и расскажет.

Александр Гончар - эксперт решений Qlik согласился поделиться опытом и рассказать про возможности аналитического инструмента и своего опыта. Уже более 10 лет он руководит консалтинг компанией А2, которая занимается внедрение решений Qlik и решений бизнес аналитики в СНГ и Северной Америке.
Сейчас начнется!
Дашборд Qlik в 2012 года, в котором CLS закрашивался в зависимости от выполнения плана. Мотивация для менеджера по продажам наверное))
А вот термин, которые активно развивается в Data Science/Machine Learning - Feature Store. То есть отдельное хранилище для наших атрибутов моделей. Большая статья тут про это.
Forwarded from Reveal the Data
Что почитать на выходных

📄 Статья с основными принципами дизайна Нормана. Полезно и коротко. Где нашёл: Агентство ADN

▶️ Выступления команды DMP/DWH Яндекс Go на конференции Smart Data. Где нашёл: Под капотом Я.Такси

🗂 Подборка визуализаций сделанных в физическом воплощении. Где нашёл: Дата-виз чат

💡Дата-йога и Qlik запускают бесплатный марафон по data-literacy. Где нашёл: Чат Tableau

📄 Небольшая приятная статья про квартет Энскомба. Где нашёл: Настенька и графики

▶️ Выступление Димы Аношина про современный аналитический стек. Где нашёл: Инжиниринг данных

💼 Vizuators из Минска ищут себе разработчиков Tableau. Ребята очень прикольные, присмотритесь к ним. Где нашёл: KZ BI Community

#дайджест
Из нашего slack:

Всем привет! 8 марта будет такая конференция - "Women in Data Science Conference в Санкт-Петербурге"
https://wdl-hse.org/wids2021rus
Описание:
"Приглашаем вас на конференцию Women in Data Science St. Petersburg (WiDS'21 St. Petersburg), которая в этом году пройдет полностью онлайн (на площадке Zoom) в рамках инициативы Глобальной конференции женщин в науке о данных, организуемой в Стэнфордском университете и более чем на 200 площадках по всему миру.
Конференция направлена на развитие сообщества Data Science, приглашаются все желающие, без каких-либо ограничений по уровню подготовки, возрасту или полу. За один день конференции вы узнаете, что такое предиктивный анализ и как он используются в анализе сети ресторанов (Яна Одинцова). Также мы познакомимся с процессом семантического поиска на примере из индустрии (Луиза Сайфуллина, SILO AI) и поговорим об оценке качества образования в анализе данных (Ирина Богданова, СПб ЦОКОиИТ). С участницами карьерной панели (Луиза Сайфуллина, SILO AI, Элина Валеева, Meditivity, Ксения Певзнер, Okko, Евгения Ребрикова, Пивоваренная компания «Балтика») обсудим, что нужно, чтобы начать заниматься Data Science, где найти актуальную информацию для развития, обсудим на примерах наших участниц, как стать аналитиком данных. И, конечно, будет живая сессия вопросов-ответов -- не упустите шанс спросить то, что давно вас интересовало в Data Science. И конечно, вас ждет много возможностей узнать что-то новое, поделиться своим опытом и познакомиться с новыми людьми (да, онлайн это тоже делать можно).
Адрес
8 марта, 2021
ссылка в ZOOM"
Еще один пример, когда Data Science берет на вооружение техники из DW - блог про использование Data Vault.

А вот пару статей с Хабр про Data Vault (это альтернатива Dimensional Modelling):
Введение в Data Vault
Основы Data Vault
Смелое заявление, что будущее BI это open source! Все бы ничего, но только это написано от имени BI компании, которая создала коммерческий Apache Superset - Preset.
DBT tool уже открыла регистрацию на свою конференцию https://coalesce-2021.heysummit.com
Facebook провел исследования про “silent data corruption”, это когда есть незначительные проблемы в загрузке и трансформации данных, но если посмотреть на проблему в масштабе крупной компании, то это очень плохо.
Microsoft делится onboarding планом для команды Data Science.
Статья, которая рассматривает подходы для data quality

There are two types of data quality issues in this world: those you can predict (known unknowns) and those you can’t (unknown unknowns). Here’s how some of the best data teams are taking a more comprehensive approach to tackling both of them at scale.
Спустя год, организуем 2ю сессию по Snowflake Vancouver User Group. Спасибо Николаю за его время! Так же у меня meetup по Calgary и Toronto, то есть вся аудитория (пока маленькая) в Канаде по Snowflake нас должна знать и видеть))