Автоконфигурируемость ETL: как мы сделали ETL устойчивым к постоянным изменениям в структуре входных данных
Источник
Источник
Telegraph
Автоконфигурируемость ETL: как мы сделали ETL устойчивым к постоянным изменениям в структуре входных данных
Типичный диалог на планировании: Лид: — Пользователи просят репликацию вот этих колонок в этих таблицах из продакшен базы в data lake. Разработчик: — Когда? Лид: — Вчера. Запрос в таску, таску в спринт, а дальше вручную исследование входных данных,…
Бесплатный онлайн-учебник по машинному обучению и Data Science от Школы анализа данных Яндекса:
— разбор основных методов и алгоритмов ML.
— важные для ML разделы математики: матричное дифференцирование, статистика, методы оптимизации.
— примеры использования ML в жизни.
Пока доступны первые две главы — «Классические методы обучения с учителем» и «Оценка качества моделей», но скоро появятся и новые разделы: про вероятностный подход к ML, обучение представлений и многое другое.
Учебник будет регулярно пополняться, ведь и ML не стоит на месте — постоянно появляются новые подходы и направления. Сохраняйте в закладки!
— разбор основных методов и алгоритмов ML.
— важные для ML разделы математики: матричное дифференцирование, статистика, методы оптимизации.
— примеры использования ML в жизни.
Пока доступны первые две главы — «Классические методы обучения с учителем» и «Оценка качества моделей», но скоро появятся и новые разделы: про вероятностный подход к ML, обучение представлений и многое другое.
Учебник будет регулярно пополняться, ведь и ML не стоит на месте — постоянно появляются новые подходы и направления. Сохраняйте в закладки!
😢1
Хранилище данных vs. Data Lake. Или почему важно научиться ходить перед тем, как начать бегать
Источник
Источник
Telegraph
Хранилище данных vs. Data Lake. Или почему важно научиться ходить перед тем, как начать бегать
Всем привет! Я Игорь Гончаров — руководитель Службы управления данными Уралсиба. В этой статье я поделился нашим видением ответа на вопрос, который периодически слышу от коллег: зачем мы развиваем хранилище данных банка, когда есть технологии Data Lake? Очевидно…