«Национальная Лотерея» строит хранилище данных на продуктах Arenadata

Бренд всероссийских государственных лотерей «Национальная Лотерея» реализует проект по строительству нового хранилища данных

Бренд всероссийских государственных лотерей «Национальная Лотерея» реализует проект по строительству нового хранилища данных. В его рамках он использует продукты Группы Arenadata — аналитическую MPP-СУБД Arenadata DB (ADB) и систему управления корпоративными данными Arenadata Catalog (ADС).

«Национальная Лотерея» исторически применяла несколько баз данных и имела множество различных источников, не объединенных в единое хранилище, что усложняло накопление и получение ценных для бизнеса аналитических выводов. Бизнес-пользователи нуждались в детальной аналитике и оперативном получении отчетности. Чтобы удовлетворить возникающие потребности бизнеса, было принято решение о создании единого хранилища данных (Data Lakehouse), в т. ч. использование Arenadata DB для запуска аналитической CRM. Это одновременно повышало стабильность получения данных, качество хранения и накопления, сокращало время получения их дата-аналитиками и бизнесом.

«Мы уже внедрили, настроили и заполнили бизнес-глоссарий, каталоги метрик и показателей. Сейчас все наши метрики ведутся в Arenadata Catalog. Благодаря внедрению продукта мы смогли спроектировать и построить иерархию связи, реализовали пирамиды метрик и обеспечили их визуализацию. Теперь мы видим все дашборды, их связи с данными, связываем data lineage с метриками в одном месте. Плюс смогли подключить BI-инструмент, и Arenadata Catalog еще выполняет роль централизованного каталога дашбордов. Команда „Национальной Лотереи“ использует ADC как полный единый источник знаний бизнеса о своих данных. Также его внедрение ускорило онбординг новых и повысило качество работы действующих сотрудников», — отметил Евгений Жилов, CDO компании «Национальная Лотерея».

Реализация проекта по строительству целевой архитектуры хранилища данных позволила команде «Национальной Лотереи» улучшить качество данных в компании и производительность хранилища. В его результате удалось:

  • сократить в 75 раз среднее время выполнения запроса;
  • сократить количество ошибок при выполнении запросов в 7,5 раза;
  • в 2 раза сократить количество ошибок по переполнению памяти;
  • уменьшить время загрузки данных в 6 раз;
  • настроить возможность получения обновления аналитической отчетности каждые 20 минут;
  • сократить время расчета nRT-показателей в 15 раз.

Кроме того, производительность команды дата-аналитики за год выросла в 6 раз, а показатель Т2Data по отчетности сократился до 5–10 минут и дата-аналитики — до 1 дня в базовых сценариях.

Как отметил Евгений Жилов, благодаря переходу на новый Data Lakehouse и внедрению продуктов Arenadata «Национальной Лотереи» удалось полностью автоматизировали семь ключевых отчетов для компании, которые раньше готовились вручную, и теперь компания может развивать подходы Data Governance. Также она дополнительно нивелировала влияние ключевых рисков, включая риски систем алертинга и мониторинга. С хранилищем и бизнес-глоссарием работают ключевые команды компании, например бизнес-подразделение, финансы, стратеги, продукты. Важно, что дата-офис «Национальной Лотереи» состоит всего лишь из нескольких дата-инженеров, которые поддерживают обслуживание более 100 регулярных отчетов и дашбордов.

«Проект, реализованный „Национальной Лотереей“, наглядно демонстрирует набирающий актуальность тренд: прежде чем внедрять решения по работе с данными и строить крупные хранилища, необходимо обеспечить качество данных компании. Такой подход позволяет эффективно подойти к дальнейшей реализации задач по цифровизации», — считает Юлия Ильина, директор департамента по работе с финансовым сектором и международным бизнесом Arenadata.

Arenadata Catalog (ADС) — система управления корпоративными данными, которая помогает организациям внедрять процессы Data Governance. Система объединяет в едином интерфейсе каталог метаданных, бизнес-глоссарий, поиск, профилирование и проверку качества данных, платформу сотрудничества пользователей, автоматическое построение Data Lineage и другие функциональные возможности.

Arenadata DB (ADB) — аналитическая распределенная MPP-СУБД, построенная на базе проекта с открытым исходным кодом Greengage. Применяется в критически важных системах, работающих с большими объемами данных.

Arenadata DB предназначена для работы с большими аналитическими запросами и способна содержать в корпоративном хранилище десятки терабайт данных.