В системе реализован http метод /metrics для забора метрик в prometheus по pull модели. Система предоставляет текущие значения по каждой метрике в формате
prometheus
Реализованы след метрики:

  • Метрики использования системных ресурсов (CPU и Memory);
  • Время исполнения входящих запросов;
  • Время исполнения обращений к СПО;
  • Количество успешных/неуспешных обращений к СПО.

Для метрик используется агрегирующая функция - среднее

Обращения к СПО - обращения к внешним сервисам, модулям, которые не входят
в состав поставляемого сервиса: api операционной системы, внешние web сервисы,
системное ПО и т.п.

Пример метрик
# HELP cpu_usage cpu usage
# TYPE cpu_usage gauge
cpu_usage{service="dashboard"} 0
cpu_usage{service="gateway"} 0.5999939722211486
cpu_usage{service="logstash"} 0.19999780186397734
cpu_usage{service="manager"} 1.9999260531368988
cpu_usage{service="total"} 2.799917827222025
# HELP memory_usage memory usage
# TYPE memory_usage gauge
memory_usage{service="dashboard"} 0.4134044945240021
memory_usage{service="gateway"} 0.4434049427509308
memory_usage{service="logstash"} 0.2490500509738922
memory_usage{service="manager"} 1.025638222694397
memory_usage{service="notifications"} 0.2388543039560318
memory_usage{service="total"} 1.9569475203752518
# HELP request_count count request
# TYPE request_count gauge
request_count{status="failed"} 10272
request_count{status="success"} 60012
request_count{status="total"} 70284
  • Нет меток