RedLab масштабировала ИТ-инфраструктуру для интернет-провайдера
DevOps-инженеры RedLab оптимизировали имеющиеся ИТ-ресурсы и внедрили набор инструментов и сценариев, нацеленных на автоматизацию разработки
Задача:
Увеличить мощности программы и обеспечить ее бесперебойную работу.
Причина:
Недостаточная емкость ИТ-инфраструктуры приводила к снижению стабильности системы, что негативно влияло на удовлетворенность абонентов.
О проекте
Для интернет-услуг провайдер использует технологию FTTB на базе скоростных волоконно-оптических магистралей с большим запасом пропускной способности. Из-за роста пользовательской базы и расширения спектра услуг требовалось модернизировать инфраструктуру.
Клиент сформулировал ряд функциональных требований к системе:
- Повышенная доступность: обеспечение сбалансированной нагрузки и распределение трафика по сети.
- Улучшенная производительность: добавление новых узлов, серверов и других компонентов для увеличения скорости выполнения задач.
- Непрерывное развертывание: внедрение инструментов DevOps, позволяющие быстро и легко управлять разработкой ИТ-продукта.
Реализация
Технологический стек:
- Docker
- Kubernetes
- Airflow
- Tensorflow
- Istio
- Velero
- Kube-prometheus-stack
- Helmwave
- ArgoCD
- Apache
- Kafka
В ходе проекта DevOps-инженеры RedLab провели следующие работы:
- Перенесли систему с платформы Nomad на Kubernetes, что позволило автоматически масштабировать приложения и эффективно использовать ресурсы.
- Создали личный GitLab, в котором настроили CI/CD. В нем же стали хранить инфраструктурный код Ansible и Terraform, чтобы отслеживать историю изменений в программе, контролировать проекты и репозитории.
- Организовали управление сетевой инфраструктуры по принципу IaC (Infrastructure as Code) для 2.000 коммутаторов и 30.000 активных абонентов — удалось масштабировать сеть и применить изменения к сетевым устройствам без ручного вмешательства.
- Для хранения секретных данных выбрали сервис HashiCorp Vault в режиме высокой доступности (HA). Единая авторизация теперь происходит через Keycloak OIDC.
- Написали 30 Helm чартов, которые обеспечили повторяемость развертываний компонентов и помогли легко управлять зависимостями, версиями и конфигурациями системы.
- Разместили автоматический учет оборудования в NetBox. Теперь найти информацию об устройствах, отследить их местоположение и историю стало проще.
- Установили приватное облако на Opennebula с AutoDiscovery от Consul на 40 серверах, что привело к эффективному распределению ресурсов между различными виртуальными машинами.
- Осуществили мониторинг и наблюдаемость ИТ-инфраструктуры на стеке Prometheus, Grafana, Alertmanager и NetXMS. Технологии помогают обрабатывать большое количество метрик в реальном времени, своевременно обнаруживать и устранять сбои.
Благодаря масштабированию ИТ-инфраструктуры удалось автоматизировать большинство рутинных операций и повысить производительность интернет-проекта. Провайдер смог предложить абонентам более стабильное и качественное обслуживание, тем самым удержать имеющихся клиентов и привлечь новых.