Data Капитал

Правила игры и судейская бригада. DataOps встречает Data Governance.

Мы собрали команду, отточили комбинации и экипировались. Но представьте матч без правил и судей. Первая же силовая борьба у ворот превратится в драку, а результат матча будет оспорен. В мире данных ту же анархию устраняет Data Governance, свод правил и арбитров, которые делают игру честной, безопасной и предсказуемой.

Если DataOps, это ваша команда, которая гоняет шайбу по льду, то Data Governance, это официальный регламент лиги, судейская бригада и дисциплинарный комитет.

Кто есть кто на ледовой арене данных?

Главный судья и регламент (Политики и стандарты). Это стандарты, регламенты и правила Компании, зафиксированные в нормативных документах Компании. Например: «Персональные данные клиентов (PII) должны быть зашифрованы» или «Ключевые метрики определяются только в центральном каталоге данных Компании».

Линейные судьи и судьи за воротами (Владельцы данных и стюарды). Это эксперты, аудиторы, контролеры и руководители, которые следят за нарушениями в своей зоне ответственности. Владелец данных отвечает, чтобы правила для его данных соблюдались. Стюард помогает их технически реализовать.

Видеопомощник судьи (Каталог данных). Вспомним наш «архив видеоповторов» из Поста "Видеоповторы и статистика: Каталог данных как система анализа "игры".". Каталог, это и есть та самая система, которая фиксирует, какие данные к какому классу относятся, кто за них отвечает, и кто их использует. Он и есть главный свидетель для принятия решений.

Как DataOps выполняет правила на льду? Автоматизация вместо бюрократии.
Самая большая ошибка считать или предполагать, что Governance это собрания, сотня бумаг и запреты. В современной игре правила встраиваются прямо в процесс.

Автоматический «допрос видео» (Проверка политик в пайплайне).

Раньше (Бюрократия), необходимо было, чтоб Инженер, который создаёт новую витрину с данными клиентов, должен прочитать 50-страничный PDF, заполнить заявку на доступ и ждать неделю разрешения от информационной безопасности и руководящего комитета.

Сейчас (DataOps), в пайплайне (нашей отработанной комбинации) стоит автоматический тест. Если он обнаруживает, что в данных есть поле «номер паспорта», система автоматически применяет к нему правило шифрования, проверяет права доступа и регистрирует действие в каталоге. Нарушение просто не пройдёт «синюю линию».

Сигнал судье через датчик в шайбе (Мониторинг и алерты).

Раньше о нарушении (например, утечке данных) узнавали постфактум.

Теперь система мониторинга (Observability), это как датчики в самой шайбе и на форме игроков. Она в реальном времени отслеживает аномальные контакты, доступы или попытки выгрузить слишком большой объём чувствительных данных и мгновенно отправляет сигнал «судейской» (команде безопасности).

Единый реестр всех игроков (Каталог как источник истины).

Governance отвечает на вопросы: «Кто чем владеет?», «Что является эталоном?». Каталог данных (наш видеоархив) становится техническим воплощением этих ответов. Когда у всех на виду, какая витрина является официальным источником по продажам, исчезают споры и путаница.

Предлагаем рассмотреть подход, как начать «играть» по правилам, не задушив игру бюрократией?
Не пытайтесь сразу прописать устав всех лиг чемпионата и всех турниров, которые планируете осуществлять. Начните с одного самого важного правила для одной ключевой игры.

Выберите одно правило. Например: «Все финансовые отчёты должны строиться только из данных, прошедших проверку на качество».

Встройте его в комбинацию. Модифицируйте ваш пайплайн для финального финансового отчёта так, чтобы он технически не мог взять данные, не прошедшие проверку DQ (те самые «шлемы» из Поста "Экипировка чемпиона: Клюшки, коньки и шлемы DataOps").

Зафиксируйте это в каталоге. В каталоге данных отметьте эту витрину как «Официальный источник для финансовой отчётности». Теперь это не просто чьё-то мнение, а зафиксированный и видимый всем факт.

#DatаOps@data_capital

56 viewsedited 05:10