Перейти к основному содержимому
Версия: 1.11.0

Типы событий и их обработка

Вы можете интегрировать свой экземпляр SimpleOne с любой системой активного мониторинга (AMS) для наблюдения за стабильностью и производительностью вашей системы. Основная функция AMS состоит в том, чтобы запрашивать статусы объектов наблюдения и при необходимости генерировать оповещения. После этого с помощью механизма обмена данными между AMS и экземпляром SimpleOne на основе этих оповещений создаются события с нужным типом оповещения и некоторыми параметрами, заданными правилами мониторинга. Это могут быть исключительные, предупреждающие и информационные события.

На следующей схеме показан процесс мониторинга и управления событиями.

Исключительные события


Исключительные события имеют наивысший приоритет в списке. Примером таких событий может быть недоступность сервера или любого другого важного сервиса.

Ниже приведен пример обработки исключительных событий с помощью механизма корреляции событий:

  1. AMS отправляет сообщение, что сервер недоступен.
  2. На экземпляре SimpleOne в соответствии с заданными правилами мониторинга создается Исключительное событие мониторинга, основанное на сообщении и находящееся в статусе Активно.
  3. Событие проверяется на соответствие правилу событий. Система начинает обратный отсчет периода повторной проверки (например, он составляет три минуты). По истечении этого периода проводится повторная проверка.
примечание

Если в правиле установлен флажок Игнорировать корреляцию событий, то выполнение связанных действий происходит без повторной проверки. В отличие от других типов, связанные действия для таких исключительных событий выполняются при каждом полученном сообщении, независимо от того, выполнялись они при получении прошлого сообщения или нет.

  1. По истечении периода система проверяет статус события, связанного с сообщением (система мониторинга обновляет статус сообщений, и статус событий синхронизируется с ними):
    1. Если событие по-прежнему находится в статусе Активно, сразу создается инфраструктурный инцидент.
    2. Если статус события изменился на Неактивно, то создавать инцидент не требуется.

Предупреждающие события


Предупреждающие события имеют более низкий приоритет, чем исключительные. Примером предупреждающего события может быть нехватка места на диске.

Ниже приведен пример обработки таких событий с помощью механизма корреляции событий:

  1. AMS выдает предупреждение, что место на диске заканчивается, осталось X Мбайт.
  2. На экземпляре SimpleOne в соответствии с заданными правилами мониторинга создается Предупреждающее событие, основанное на сообщении от AMS и находящееся в статусе Активно.
  3. В отличие от исключительных событий система не начинает обратный отсчет периода повторной проверки. В соответствии с заданными настройками, для запуска периода повторной проверки должно быть два активных предупреждающих события для данного AMS-сообщения.
  4. Если получено второе событие типа Предупреждающее, то тогда начинается период повторной проверки. Период должен пройти прежде чем можно будет предпринять какие-либо действия.
  5. По истечении периода система проверяет статус событий, связанных с сообщением (система мониторинга обновляет статус сообщений, и статус событий синхронизируются с ними):
    1. Если все события по-прежнему находятся в статусе Активно, сразу создается инцидент.
    2. Если хотя бы одно событие Неактивно, то создавать инцидент не требуется.

Информационные события


Информационные события имеют самый низкий приоритет и носят исключительно информационный характер. Примером информационного события является уведомление об авторизации пользователя. Должно произойти много однотипных событий за заданный период, например, десять попыток входа в систему за одну минуту от одного и того же пользователя.

Ниже приведен пример обработки информационных событий с помощью механизма корреляции событий:

  1. AMS отправляет сообщение о каждой неудачной попытке входа в систему.
  2. Модуль "События и мониторинг" собирает информацию о десяти попытках входа в систему за одну минуту от одного и того же пользователя.
  3. Система создает инцидент о подозрительной активности. В этом случае период повторной проверки не требуется.