Невозможно управлять тем, что не измеряется. Цель KPI — обеспечить качественный пользовательский опыт, удовлетворенность клиентов и комфортную работу команды, снижая количество внеплановых инцидентов и ночных реагирований.
В индустрии для этого используют проверенные наборы метрик. Первая группа — это «золотые сигналы»: latency, traffic, errors и saturation. Вторая — подходы вроде RED (rate, errors, duration) и USE (utilization, saturation, errors). Все они во многом пересекаются и описывают систему с разных сторон.
На практике можно определять KPI, опираясь на ограниченный набор показателей:
- Бизнес-транзакции — за чем важно следить;
- Время отклика — как быстро отвечает система;
- Количество вызовов — какая нагрузка на сервис;
- Количество ошибок — насколько надежно приложение;
- Здоровье приложения (Apdex) — довольны ли пользователи.