Data Sapience 15 июля 2025

Внедрение Data Ocean Nova и DOG.DQ от Data Sapience в «Апельсин»

Сервис Апельсин использует продукты Data Sapience для централизованного хранилища данных, расширив знания о клиентах и повысив эффективность бизнеса партнеров

Продукты вендора Data Sapience теперь используются в сервисе Апельсин: совместно с интегратором GlowByte компании внедрили универсальную lakehouse-платформу данных Data Ocean Nova и решение для управления качеством данных Data Ocean Governance DQ.

Созданное на основе этих продуктов централизованное хранилище стало основой для оперативного анализа и построения отчетности, значительно ускорив процессы принятия решений и улучшив бизнес-аналитику. Были реализованы механизмы управления качеством данных.

За время реализации проекта специалисты GlowByte развернули в инфраструктуре клиента lakehouse-платформу и BI-систему, создали и наполнили озеро данных, подключив все необходимые источники, настроили основные проверки, реализовали фреймворк обработки и трансформации данных, предоставили доступы пользователям. В BI-системе были созданы необходимые дашборды для формирования отчетности по ключевым KPI.

В основу новой ИТ-архитектуры легла универсальная lakehouse-платформа Data Ocean Nova, которая решает комплексные задачи массивно-параллельной обработки данных. Технология Trino используется для задач интеграции с источниками: несколькими базами PostgreSQL, кластером Hadoop, поставщиками данных по маркетинговым и поведенческим метрикам из сторонних сервисов. 

Процессинговый движок Impala выполняет трансформацию информации и формирует ODS/EM-слои, одновременно служа движком для интерактивного SQL-анализа больших объемов, обеспечивая аналитикам быстрый отклик сложных аналитических запросов. Благодаря Apache Superset бизнес-пользователи самостоятельно создают и просматривают интерактивные дашборды, применяют гибкие фильтры и делятся отчетами. Data Ocean Governance DQ отвечает за контроль полноты, согласованности и актуальности информации, сигнализируя о любых проблемах в потоках ETL.

Оперируя информацией из разных источников, платформа позволяет создавать подробный профиль клиента. В его структуре — сведения о покупательском поведении, финансовых операциях, телеком-услугах и страховых предпочтениях. Ранее такой подход был невозможен из-за разрозненности информации.

В будущем планируется масштабирование хранилища по мере роста объемов и появления новых источников информации. Гибкость позволит компании управлять большими массивами без потери скорости и качества анализа. Развитая аналитика поможет «Апельсину» выявлять новые сегменты клиентов, точнее понимать их потребности и усиливать персонализацию. В итоге организация привлечет новых клиентов и повысит лояльность существующих. 

Наличие централизованной платформы открывает возможности для внедрения передовых технологий, связанных с машинным обучением и искусственным интеллектом. Это позволит оптимизировать текущие процессы и предсказывать будущие тренды, повышая конкурентоспособность компании на рынке.

Присоединяйтесь к компаниям, которые уже делятся новостями бизнеса на РБК КомпанииУзнать больше