Zabbix

Повторяющиеся уведомления в Zabbix

Система мониторинга Zabbix в стандартной установке предлагает один тип оповещений на события — одноразовое уведомление при срабатывании триггера. Если ты по какой-то причине не заметил уведомление, или забыл на него среагировать, через некоторое время ситуация может стать критической. В таком случае могут быть полезны повторяющиеся напоминания о том, что проблема еще не исправлена.


Введение

Тема повторных уведомлений хорошо освещена в официальной документации заббикс. В разделе про Эскалации рассказано, как управлять оповещениями, в том числе делать их повторными. Сам я без проблем разобрался на основе документации, но тем не менее для полноты картины настройки zabbix, подробно раскрою эту тему у себя на конкретном примере.

Дальнейшие действия я буду выполнять в системе CentOS 7 и версии Zabbix сервера 3.4.6. Все описанное ниже будет актуально и для других систем и версий заббикса, так как разработчики стараются максимально сохранять совместимость между версиями.

Подготовка тестового триггера

Я в своих статьях по настройке заббикса часто использую в качестве примера триггер, который срабатывает, когда залогиненных пользователей в системе становится больше 2-х. Он основывается на стандартном итеме шаблона Template OS Linux — Number of logged in users.

Подготовка тестового триггера

Триггер срабатывает, когда каждое из двух последних значения залогиненных в систему пользователей больше двух (count(#2,1,»gt»)}=2), выключается, когда последнее значение залогиненных пользователей меньше двух (last(#1)}<2). То есть, когда мы заходим двумя пользователями на сервер, через 2 минуты срабатывает триггер. Когда остается только один пользователь или вообще ни одного, через минуту триггер выключается.

Прежде чем двигаться дальше, рекомендую проверить работу триггера и оповещений и убедиться в том, что все работает правильно. Далее я настрою оповещения, которые будут повторяться каждую минуту до тех пор, пока залогиненных юзеров не станет меньше двух.


Настройка повторяющегося оповещения

После того, как убедились, что тестовый триггер работает, настроим для него повторяющееся уведомление. Для этого идем в раздел Настройка -> Действия и нажимаем Создать действие.

Создание нового действия

Во вкладке Действие указываете имя и добавляете тестовый триггер.

Условия срабатывания действия

Дальше переходим в раздел Операции и указываем длительность шага равное 1 минуте. Добавляем шаг с параметром 1 — 0 и указываем необходимое действие. В примере я просто буду отправлять всем администраторам оповещение на почту.

Настройка повторения оповещений

Сохраняйте настроенное действие и ждите срабатывания триггера. Вы должны получать оповещение на почту каждую минуту до тех пор, пока триггер не будет отключен. Обращаю внимание, что вы получите оповещение и от стандартного правила, которое шлет один раз и от нового, которое повторяющееся. Чтобы все было красиво и удобно, необходимо отключать стандартное оповещение и создавать свои с определенными правилами в зависимости от типа триггера.


Заключение

На такие события не требуется мгновенная реакция. Она может последовать и через несколько дней. Но когда откладываешь действие на несколько дней вперед, очень легко забыть о нем. Тут придут на помощь ежедневные напоминания о проблеме. Я их настроил вот так:

Уведомление о делегировании домена
Повторяющееся уведомление с интервалом в 1 день

Если вы настроили мониторинг бэкапов, который выполняется ночью, то его тоже не обязательно чинить в ту же минуту, можно отложить на вечернее время. Чтобы не забыть, можно настроить уведомления раз в 2 часа. И так далее. Смысл, я думаю, понятен.


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *