Юниверс Дата 9 октября 2025

Data Governance и искусственный интеллект: как навести порядок в данных

Почему Data Governance играет важную роль при внедрении искусственного интеллекта

Александр Богданов
Руководитель отдела поддержки продаж Департамента управления продуктами

Более 10 лет занимается проектами в области управления данными для государственных структур и для крупных и средних коммерческих организаций (MDM, Data Governance, Data Quality).

Искусственный интеллект (ИИ) уже перестал быть модным словом из презентаций. Он внедряется в бизнес-процессы: чат-боты отвечают клиентам, алгоритмы прогнозируют спрос и ценообразование, автоматизированные системы помогают принимать решения.

Но реальность такова, что качество решений ИИ напрямую зависит от качества данных, на которых он обучается и работает. Если в информации хаос, ИИ будет воспроизводить этот хаос в еще более крупных масштабах. Расскажем, какую роль играет Data Governance (DG) при внедрении ИИ.

Почему ИИ без Data Governance неэффективен

  1. Данные низкого качества — плохие модели.
    Алгоритм не умнее данных, на которых он обучается. Если клиент записан в одной системе как «ООО Альфа», в другой как «Альфа ООО», а в третьей как «Alfa Ltd» — ИИ не сможет адекватно прогнозировать поведение клиента.
  2. Недоверие к предсказаниям.
    Руководители не будут полагаться на результаты ИИ, если не понимают, откуда берутся данные, насколько они свежие и корректные. Без прозрачности ИИ остается «черным ящиком».
  3. Регуляторные риски.
    Особенно в банковской, медицинской и телеком-сферах. Если ИИ обучен на ошибочных или неполных данных, решения могут противоречить закону и привести к штрафам.
  4. Рост затрат.
    Чем позже компания замечает ошибки, тем дороже их исправлять. Перенастроить модель и очистить миллионы записей сложнее, чем сразу выстроить процесс правильного управления.

Как Data Governance помогает внедрять ИИ

1. Определение владельцев данных.
У каждой группы данных назначается ответственный (data owner). Это снимает хаос, когда непонятно, кто отвечает за корректность информации.

2. Стандарты и единые форматы.
DG задает правила: как хранить даты, как записывать названия компаний, какие поля обязательны. Это снижает вариативность и делает данные пригодными для обучения моделей.

3. Каталог данных.
ИИ должен знать, какие источники можно использовать. Каталог позволяет быстро находить нужные наборы данных, понимать их происхождение и уровень качества.

4. Контроль качества (в связке с Data Quality).
DG описывает процесс контроля, а Data Quality дает инструменты. Вместе они гарантируют, что модели учатся только на очищенных и проверенных данных.

5. Безопасность и доступ.
DG определяет, какие данные можно использовать для ИИ, а какие — нет. Это особенно важно при работе с персональными или конфиденциальными сведениями.

Пример из практики

Кейс: банк и скоринговая модель.

Банк внедрял ИИ для оценки кредитных рисков. Первая версия модели показала крайне низкую точность: она занижала риск по проблемным заемщикам. Причина оказалась в данных: дубли клиентов, пропуски в транзакционной истории, несогласованные статусы.

Что сделали:

  • назначили владельцев данных по клиентам и операциям;
  • стандартизировали поля (например, формат даты и кодировку валют);
  • создали каталог, где четко описаны источники и правила доступа;
  • запустили процесс регулярной проверки качества данных.

Результат: новая модель повысила точность прогнозирования невозвратов на 25%, снизила количество ложноположительных решений и укрепила доверие к ИИ внутри компании.

DG и разные сценарии использования ИИ

Маркетинг и продажи.
DG обеспечивает единый справочник клиентов, благодаря чему модели персонализации работают корректно. Без этого один и тот же клиент может получать три разных предложения.

Финансы.
DG помогает поддерживать единый формат отчетных данных. ИИ для прогнозирования выручки или оценки рисков не «спотыкается» на дубли и ошибки.

Операции и логистика.
Чистые и согласованные данные позволяют алгоритмам точнее прогнозировать спрос, оптимизировать маршруты и снижать издержки.

HR.
 При подборе персонала DG помогает структурировать резюме, навыки и показатели эффективности, чтобы алгоритмы подбора и оценки сотрудников были объективными.

Рекомендации для компаний

  1. Начинайте с пилота.
    Возьмите один сценарий применения ИИ (например, прогноз спроса) и наведите порядок именно в этих данных.
  2. Назначьте ответственных.
     Без «хозяев данных» ИИ будет использовать разрозненные и неконтролируемые наборы.
  3. Формализуйте правила.
     Даже базовые стандарты (например, одинаковый формат даты) резко повышают эффективность моделей.
  4. Создайте каталог данных.
     Это экономит время аналитиков и повышает доверие к источникам.
  5. Интегрируйте DG в культуру компании.
     Управление данными должно быть не проектом «под внедрение ИИ», а постоянной практикой, которая поддерживает все процессы.

Главное

ИИ — мощный инструмент, но только при условии, что он работает с правильными данными.
Data Governance — это фундамент успешного внедрения искусственного интеллекта.

  • Модели учатся на корректных и актуальных данных.
  • Руководители доверяют результатам, потому что знают происхождение информации.
  • Компания снижает риски и быстрее масштабирует решения.

Тот, кто внедряет ИИ без DG, получает иллюзию инноваций. Тот, кто сочетает ИИ и управление данными, получает реальные конкурентные преимущества. Поэтому, если планируете внедрение ИИ-решений, то начните с внедрения Data Governance — это заложит фундамент для успешного применения искусственного интеллекта.

Присоединяйтесь к компаниям, которые уже делятся новостями бизнеса на РБК КомпанииУзнать больше