Deckhouse Observability Platform получила возможность хранения трейсов
Теперь команды разработки и эксплуатации ИТ-компаний могут управлять трассировками распределенных запросов на уровне платформы
Deckhouse, разработчик продуктов для построения надежной enterprise-инфраструктуры, запустил хранилище мониторинга (трассировки) жизненного цикла запросов или событий (трейса) в платформе наблюдаемости Deckhouse Observability Platform (DOP). Теперь команды разработки и эксплуатации ИТ-компаний могут управлять трассировками распределенных запросов на уровне платформы: с настройкой лимитов, прав доступа и встроенным мониторингом, без необходимости развертывать отдельные решения для каждого сервиса.
Deckhouse Observability Platform — централизованная платформа наблюдаемости для гибридной и Kubernetes-инфраструктуры. Решение объединяет метрики, логи и трассировки приложений, физических серверов, виртуальных машин, сетей и Kubernetes-кластеров в одной системе.
Хранилище трейсов закрывает ключевую проблему микросервисных архитектур. В распределенной системе один пользовательский запрос проходит через множество сервисов, и при деградации или ошибке командам сложно быстро понять, где именно произошел сбой. Без трассировок поиск первопричины занимает много времени, что увеличивает среднюю продолжительность восстановления сервисов.
Внедрение хранилища трейсов в DOP сокращает время на поиск причин инцидентов: trace ID связывает спаны всех сервисов в единую цепочку, позволяя мгновенно увидеть путь запроса. Решение упрощает отладку распределенных систем — инженеры получают подробную информацию о поведении приложения, длительности выполнения команд и последовательности вызовов. Локализация проблемы становится объективной: сразу видно, в каком сервисе возникла задержка и какая команда ответственна за ее устранение, что снижает количество споров при инцидентах.
Особое внимание уделено надежности и управляемости самого компонента. В DOP реализован внутренний мониторинг хранилища трейсов, который включает сбор ключевых метрик: нагрузка, ошибки, задержки, потребление ресурсов и состояние операций записи и чтения. Для визуализации состояния хранилища предусмотрены специализированные дашборды, ускоряющие локализацию проблем инфраструктуры наблюдаемости. Система алертинга автоматически оповещает о деградации или отказе по заданным условиям, сокращая время реакции команды и не позволяя проблеме остаться незамеченной.
«Мы добавили в DOP хранилище трейсов, чтобы закрыть важную задачу в микросервисной среде: быстро понять, где в цепочке сервисов возникла ошибка. Для нас было важно сделать не просто хранение трейсов, а управляемый компонент платформы — с возможностью гибкой настройки, лимитами, правами доступа и внутренним мониторингом состояния. Это избавляет команды от необходимости собирать и поддерживать отдельные решения, делая работу с трассировками предсказуемой и удобной», — Константин Аксенов, директор департамента разработки Deckhouse компании «Флант»
Рубрики
Рекомендации партнеров:
Новости отрасли:
Все новости:
Публикация компании
Профиль
Контакты
Социальные сети
Рубрики
