RedLab 19 ноября 2024

RedLab масштабировала ИТ-инфраструктуру для интернет-провайдера

DevOps-инженеры RedLab оптимизировали имеющиеся ИТ-ресурсы и внедрили набор инструментов и сценариев, нацеленных на автоматизацию разработки

Задача и причина

Задача:

Увеличить мощности программы и обеспечить ее бесперебойную работу.

Причина: 

Недостаточная емкость ИТ-инфраструктуры приводила к снижению стабильности системы, что негативно влияло на удовлетворенность абонентов.

О проекте

Для интернет-услуг провайдер использует технологию FTTB на базе скоростных волоконно-оптических магистралей с большим запасом пропускной способности. Из-за роста пользовательской базы и расширения спектра услуг требовалось модернизировать инфраструктуру. 

Клиент сформулировал ряд функциональных требований к системе:

  • Повышенная доступность: обеспечение сбалансированной нагрузки и распределение трафика по сети.
  • Улучшенная производительность: добавление новых узлов, серверов и других компонентов для увеличения скорости выполнения задач.
  • Непрерывное развертывание: внедрение инструментов DevOps, позволяющие быстро и легко управлять разработкой ИТ-продукта.

Реализация

Технологический стек: 

  • Docker
  • Kubernetes
  • Airflow
  • Tensorflow
  • Istio
  • Velero
  • Kube-prometheus-stack
  • Helmwave
  • ArgoCD
  • Apache
  • Kafka

В ходе проекта DevOps-инженеры RedLab провели следующие работы:

  • Перенесли систему с платформы Nomad на Kubernetes, что позволило автоматически масштабировать приложения и эффективно использовать ресурсы.
  • Создали личный GitLab, в котором настроили CI/CD. В нем же стали хранить инфраструктурный код Ansible и Terraform, чтобы отслеживать историю изменений в программе, контролировать проекты и репозитории.
  • Организовали управление сетевой инфраструктуры по принципу IaC (Infrastructure as Code) для 2.000 коммутаторов и 30.000 активных абонентов — удалось масштабировать сеть и применить изменения к сетевым устройствам без ручного вмешательства.
  • Для хранения секретных данных выбрали сервис HashiCorp Vault в режиме высокой доступности (HA). Единая авторизация теперь происходит через Keycloak OIDC.
  • Написали 30 Helm чартов, которые обеспечили повторяемость развертываний компонентов и помогли легко управлять зависимостями, версиями и конфигурациями системы.
  • Разместили автоматический учет оборудования в NetBox. Теперь найти информацию об устройствах, отследить их местоположение и историю стало проще.
  • Установили приватное облако на Opennebula с AutoDiscovery от Consul на 40 серверах, что привело к эффективному распределению ресурсов между различными виртуальными машинами.
  • Осуществили мониторинг и наблюдаемость ИТ-инфраструктуры на стеке Prometheus, Grafana, Alertmanager и NetXMS. Технологии помогают обрабатывать большое количество метрик в реальном времени, своевременно обнаруживать и устранять сбои.
Результат

Благодаря масштабированию ИТ-инфраструктуры удалось автоматизировать большинство рутинных операций и повысить производительность интернет-проекта. Провайдер смог предложить абонентам более стабильное и качественное обслуживание, тем самым удержать имеющихся клиентов и привлечь новых.