Как оптимизировать ИТ-инфраструктуру для страховой компании
Команда RedLab устранила «узкие» места в программе и улучшила работу имеющихся компонентов в системе
Задача:
Модернизировать ИТ-решение.
Причина:
Система имела низкую производительность, недостаточную отказоустойчивость и проблемы с масштабируемостью.
О проекте
Крупная российская страховая компания предоставляет услуги страхования имущества, автомобильного страхования (Каско и ОСАГО), добровольного медицинского страхования, страхования грузов и строительно-монтажных рисков и др. Чтобы повысить качество сервиса, бизнес создает ИТ-решения, разработанные с использованием технологии блокчейн, big data и многофакторного скоринга. Клиент активно участвует в деятельности Всероссийского союза страховщиков и Ассоциации Страховщиков Жизни. Услугами организации пользуются более 9 млн клиентов, а сумма активов составляет 221 млрд рублей.
В силу стремительного развития программного решения, предназначенного для автоматизации продаж и оформления различных страховых продуктов, было необходимо улучшить ИТ-инфраструктуру, т.к. система не соответствовала требованиям бизнеса. Ситуация осложнялась отсутствием разграничения зон ответственности между системными администраторами и разработчиками, что приводило к взаимным обвинениям и тормозило рост проекта. Внутренняя экспертиза оказалась недостаточной для разрешения вопросов, поэтому клиент подключил аутсорсинговую команду.
Описание задачи
DevOps-инженерам RedLab предстояло улучшить работу имеющихся компонентов в ИТ-инфраструктуре и внедрить технологии, нацеленные на легкое управление ресурсами. Были определены следующие задачи:
- Устранение «узких» мест в системе: исключение участков кода, которые не нужны для получения конечного результата, а также других коротких последовательных вызовов между сервисами.
- Улучшение производительности ПО для продаж страховых продуктов: вертикальное и горизонтальное масштабирование, внедрение автоматизированных инструментов DevOps.
- Фиксирование зоны ответственности членов ИТ-подразделения: добавление входных данных о специалистах (ID пользователя, права, тип выбранного метода, лог или ошибка).
Реализация
С целью обеспечения надежной и функциональной системы команда RedLab провела следующие работы:
- Проанализировали текущую ИТ-инфраструктуру, а именно: существующие процессы и инструменты разработки, сборки, тестирования, доставки кода и управления окружениями.
- Передали данные с OpenTelemetry по проблемным приложениям командам разработки и Ops.
- Обновили и расширили кластер Kubernetes (K8s) с 15.х до 22.х. Новая группа вычислительных узлов позволила повысить гибкость разработки, уменьшить время развертывания программы и автоматизировать процесс управления контейнерами.
- Добавили OpenTelemetry к стандартному стеку мониторинга. Удалось улучшить видимость работы приложений и организовать единый источник данных о работоспособности инфраструктуры.
- Присвоили каждому запросу специальный идентификатор, благодаря которому можно найти конкретные ошибки в работе ПО и не искать примерно подходящие сбои по времени или по IP.
- Составили план поэтапного обновления кластеров с помощью Kubespray. Получилось легко и быстро развернуть компоненты системы.
Благодаря оптимизации программного страхового продукта удалось повысить производительность ИТ-инфраструктуры на 18%. К тому же четко разграниченные зоны ответственности помогли решить внутренний конфликт меж подразделений и обеспечить продуктивную среду для дальнейшей командной работы.