Платформа наблюдаемости GMONIT повысила стабильность работы приложений нефтяной компании
О клиенте
Один из ведущих операторов топливных карт в России (NDA). Компания обеспечивает безналичную оплату топлива для юридических и физических лиц более чем на 10 000 АЗС. Помимо этого, пользователям доступны цифровые решения для управления расходами и анализа операций, бонусные программы и скидки, а также широкий спектр товаров и услуг от партнеров.
Описание задачи
Поиск корневых причин сбоев занимал длительное время, а прозрачность цепочки возникновения инцидентов оставалась низкой.
Нагрузка на приложения росла из-за масштабирования бизнеса: подключения новых стран СНГ (+3 в 2024 году) и развития B2B-направления.
Инциденты происходили в среднем раз в сутки, в их устранение вовлекалось большое количество специалистов.
Диагностика проблем с базами данных вызывала сложности: не было ясности, связаны ли сбои с инфраструктурой, СУБД или запросами.
Наблюдаемость мобильных приложений была ограниченной: при возникновении ошибок отсутствовало понимание процессов на стороне backend.
Ранее контроль над состоянием ИТ-ландшафта был фрагментированным. О проблемах узнавали постфактум — от пользователей, а возможность проактивно выявлять деградацию систем отсутствовала. Ситуацию усложняли следующие факторы:
В этих условиях клиенту требовалось не просто расширение инструментов мониторинга, а переход к наблюдаемости (observability), позволяющей контролировать состояние ИТ-систем в связке с бизнес-метриками и оперативно устранять причины сбоев.
Клиент обозначил цели проекта:
Доступность и выручку: контроль влияния инцидентов на продажи.
Многоуровневый мониторинг: от общих KPI до детальной диагностики.
Единую систему наблюдаемости: анализ логов, метрик и событий для быстрого поиска первопричин.
Прогнозирование нагрузки: подготовка инфраструктуры к пиковым нагрузкам.
Реализация
Компания внедрила observability платформу GMONIT для мониторинга своих цифровых сервисов, включая мобильные приложения и личный кабинет пользователей. Бизнесу требовалось быстро реагировать на инциденты и поддерживать высокий стандарт качества.
В ходе опытной эксплуатации команда GMONIT:
Настроила APM-мониторинг с автоинструментацией. Сейчас ИТ-команды быстрее находят и устраняют узкие места в производительности систем и контролируют зависимости приложений и инфраструктуры.
Внедрили интерактивную карту сервисов на основе телеметрии и логов, чтобы видеть, где возникают сбои. Это упростило диагностику проблем — причина выявляется в один клик.
Реализовали сквозной мониторинг, связывающий ИТ-инфраструктуру (хосты, базы данных, NGINX), backend-часть, транзакции и конкретный URL-адрес (endpoint).
Добавили сводный индикатор APDEX, который помогает быстро оценивать общее состояние сервисов.
Настроили мониторинг внешних интеграций, чтобы видеть взаимодействие со сторонними системами и базами данных, такими как Siebel. Удалось автоматически выявлять ошибки, медленные транзакции и проблемные участки кода.
Внедрили мобильный мониторинг (RUM mobile) с поддержкой iOS и Android, SDK-обновлением без лишнего кода.
С ростом трафика цифровых сервисов клиент усилил фокус на бизнес-мониторинге, прозрачности работы сервисов и снижении финансовых потерь от простоев. В рамках проекта был реализован дашборд Здоровье бизнеса, обеспечивающий привязку технических инцидентов к бизнес-эффекту и прямую корреляцию с ключевыми метриками. Это позволило наглядно оценивать, как сбои и деградации влияют на выручку и пользовательский опыт.
Результат
Интеграция GMonit позволила ритейлеру комплексно оценить влияние ИТ на e-com благодаря кастомизированным дашбордам с понятными бизнес-метриками и определить векторы для оптимизации работы сервисов. Теперь компания может еще эффективнее анализировать клиентский путь и оперативно вносить коррективы для улучшения пользовательского опыта.
Благодаря интеграции GMonit организация сократила на 45% уровень критичных инцидентов, снизила на 30% объем трудозатрат на поиск корневой причины и устранения инцидента, улучшила Real Time мониторинг влияния ошибок на бизнес-показатели. Также с помощью observability платформы ритейлер обеспечил полноценный data-driven подход.