Платформа наблюдаемости GMONIT повысила стабильность работы приложений нефтяной компании
О клиенте
Один из ведущих операторов топливных карт в России (NDA). Компания обеспечивает безналичную оплату топлива для юридических и физических лиц более чем на 5 000 АЗС. Помимо этого, пользователям доступны цифровые решения для управления расходами и анализа операций, бонусные программы и скидки, а также широкий спектр товаров и услуг от партнеров.
Описание задачи
Поиск корневых причин сбоев занимал длительное время, а прозрачность цепочки возникновения инцидентов оставалась низкой.
Нагрузка на приложения росла из-за масштабирования бизнеса: подключения новых стран СНГ (+3 в 2024 году) и развития B2B-направления.
Инциденты происходили в среднем раз в сутки, в их устранение вовлекалось большое количество специалистов.
Диагностика проблем с базами данных вызывала сложности: не было ясности, связаны ли сбои с инфраструктурой, СУБД или запросами.
Наблюдаемость мобильных приложений была ограниченной: при возникновении ошибок отсутствовало понимание процессов на стороне backend.
Ранее контроль над состоянием ИТ-ландшафта был фрагментированным. О проблемах узнавали постфактум — от пользователей, а возможность проактивно выявлять деградацию систем отсутствовала. Ситуацию усложняли следующие факторы:
В этих условиях клиенту требовалось не просто расширение инструментов мониторинга, а переход к наблюдаемости (observability), позволяющей контролировать состояние ИТ-систем в связке с бизнес-метриками и оперативно устранять причины сбоев.
Клиент обозначил цели проекта:
Доступность и выручка: контроль влияния инцидентов на продажи.
Многоуровневый мониторинг: от общих KPI до детальной диагностики.
Единая система наблюдаемости: анализ логов, метрик и событий для быстрого поиска первопричин.
Прогнозирование нагрузки: подготовка инфраструктуры к пиковым нагрузкам.
Реализация
Компания внедрила observability платформу GMONIT для мониторинга своих цифровых сервисов, включая мобильные приложения и личный кабинет пользователей. Бизнесу требовалось быстро реагировать на инциденты и поддерживать высокий стандарт качества.
В ходе опытной эксплуатации команда GMONIT:
Настроила APM-мониторинг с автоинструментацией. Сейчас ИТ-команды быстрее находят и устраняют узкие места в производительности систем и контролируют зависимости приложений и инфраструктуры.
Внедрили интерактивную карту сервисов на основе телеметрии и логов, чтобы видеть, где возникают сбои. Это упростило диагностику проблем — причина выявляется в один клик.
Реализовали сквозной мониторинг, связывающий ИТ-инфраструктуру (хосты, базы данных, NGINX), backend-часть, транзакции и конкретный URL-адрес (endpoint).
Добавили сводный индикатор APDEX, который помогает быстро оценивать общее состояние сервисов.
Настроили мониторинг внешних интеграций, чтобы видеть взаимодействие со сторонними системами и базами данных, такими как Siebel. Удалось автоматически выявлять ошибки, медленные транзакции и проблемные участки кода.
Внедрили мобильный мониторинг (RUM mobile) с поддержкой iOS и Android, SDK-обновлением без лишнего кода.
С ростом трафика цифровых сервисов клиент усилил фокус на бизнес-мониторинге, прозрачности работы сервисов и снижении финансовых потерь от простоев. В рамках проекта был реализован дашборд Здоровье бизнеса, обеспечивающий привязку технических инцидентов к бизнес-эффекту и прямую корреляцию с ключевыми метриками. Это позволило наглядно оценивать, как сбои и деградации влияют на выручку и пользовательский опыт.
Результат
Клиент получил мощный инструмент для проактивного мониторинга, быстрого устранения проблем и поддержки роста бизнеса, включая масштабирование на новые рынки СНГ и развитие B2B-направления.
Внедрение GMONIT значительно улучшило управление ИТ-инфраструктурой. Бизнес сократил количество инцидентов на 33% (2025 год — 119 инцидентов, 2024 год — 178 инцидентов) и уменьшил время простоя сервисов на 34% (2025 год — 56 минут, 2024 год — 85 минут). Особенно платформа помогла при скачках нагрузки, позволяя быстрее находить и устранять проблемы.