Dienstag, 8. Dezember 2015

Zabbix, Cisco. Триггер доступности канала. (IP SLA)

Часто необходимо отслеживать доступность канала. Если два устройства соединены непосредственно, то можно отслеживать состояние порта. А если между двумя маршрутизаторами находится коммутатор? И если он принадлежит сторонней организации или телекому? На помощь приходит IP SLA.

UPD: ещё один способ отслеживания канала, на мой взгляд более логичный, описан здесь: http://steinkafer.blogspot.com/2016/03/ip-cisco-ip-sla.html

Настройка маршрутизатора

Настройка достаточно проста:
ip sla 2
icmp-jitter 10.100.41.6 source-ip 10.100.41.5 num-packets 5
timeout 700
threshold 3
frequency 3
Не забываем запустить проверку ip SLA:
ip sla schedule 2 life forever start-time now
Посмотреть как сконфигурирован IP SLA:
#sh ip sla configuration 2 
IP SLAs, Infrastructure Engine-II.
Entry number: 2
Owner:
Tag:
Type of operation to perform: icmp-jitter
Target address/Source address: 10.100.41.6/10.100.41.5
Operation timeout (milliseconds): 700
Packet Interval (milliseconds)/Number of packets: 20/5
Type Of Service parameters: 0x0
Vrf Name:
Schedule:
Operation frequency (seconds): 3 (not considered if randomly scheduled)
Next Scheduled Start Time: Start Time already passed
Group Scheduled : FALSE
Randomly Scheduled : FALSE
Life (seconds): Forever
Entry Ageout (seconds): never
Recurring (Starting Everyday): FALSE
Status of entry (SNMP RowStatus): Active
Threshold (milliseconds): 3 (not considered if react RTT is configured)
Distribution Statistics:
Number of statistic hours kept: 2
Number of statistic distribution buckets kept: 1
Statistic distribution interval (milliseconds): 20
Посмотреть что у нас собирается:
#sh ip sla statistics 2
IPSLAs Latest Operation Statistics
IPSLA operation id: 2
Type of operation: icmp-jitter
Latest RTT: 1 milliseconds
Latest operation start time: 10:22:36.703 VLAD Wed Dec 9 2015
Latest operation return code: OK
RTT Values:
Number Of RTT: 5 RTT Min/Avg/Max: 1/1/1
Latency one-way time:
Number of Latency one-way Samples: 0
Source to Destination Latency one way Min/Avg/Max: 0/0/0
Destination to Source Latency one way Min/Avg/Max: 0/0/0
Jitter Time:
Number of SD Jitter Samples: 4
Number of DS Jitter Samples: 4
Source to Destination Jitter Min/Avg/Max: 0/1/1
Destination to Source Jitter Min/Avg/Max: 0/0/0
Packet Late Arrival: 0
Out Of Sequence: 0
Source to Destination: 0 Destination to Source 0
In both Directions: 0
Packet Skipped: 0 Packet Unprocessed: 0
Packet Loss: 0
Loss Period Length Min/Max: 0/0
Number of successes: 272
Number of failures: 0
Operation time to live: Forever

Настройка в Zabbix

Информация об IP SLA содержится в OID: 1.3.6.1.4.1.9.9.42.1.2.10.1.1.(2) (последняя цифра это номер IP SLA)
Чтобы считать этот OID понадобится MIB: CISCO-RTTMON-RTP-MIB
Считываем OID:
Sent GET request to 10.100.41.201 : 161
rttMonLatestRttOperCompletionTime.2
1

rttMonLatestRttOperCompletionTime.18
11
rttMonLatestRttOperCompletionTime.19
2
Как видим в рабочем состоянии значение нашего OID для IP SLA 2 равно 1. Вообще этот OID означает:
"The completion time of the latest RTT operation successfully completed. The unit of this object will be microsecond when rttMonCtrlAdminRttType is set to 'jitter' and rttMonEchoAdminPrecision is set to 'microsecond'. Otherwise, the unit of this object will be millisecond."

Теперь гасим интерфейс и смотрим статистику IP SLA и значение OID:
#interface FastEthernet0/0.407
#shutdown
Смотрим статистику IP SLA 2
#sh ip sla statistics 2
IPSLAs Latest Operation StatisticsIPSLA operation id: 2Type of operation: icmp-jitter Latest RTT: NoConnection/Busy/TimeoutLatest operation start time: 11:18:24.853 VLAD Wed Dec 9 2015Latest operation return code: TimeoutRTT Values: Number Of RTT: 0 RTT Min/Avg/Max: 0/0/0
Latency one-way time: Number of Latency one-way Samples: 0 Source to Destination Latency one way Min/Avg/Max: 0/0/0 Destination to Source Latency one way Min/Avg/Max: 0/0/0
Jitter Time: Number of SD Jitter Samples: 0 Number of DS Jitter Samples: 0 Source to Destination Jitter Min/Avg/Max: 0/0/0
Destination to Source Jitter Min/Avg/Max: 0/0/0
Packet Late Arrival: 0Out Of Sequence: 0 Source to Destination: 0 Destination to Source 0 In both Directions: 0Packet Skipped: 0 Packet Unprocessed: 0Packet Loss: 0 Loss Period Length Min/Max: 0/0Number of successes: 187Number of failures: 2Operation time to live: Forever
Видим что число Number of failures начало расти.
Считываем OID еще раз:
Sent GET request to 10.100.41.201 : 161
rttMonLatestRttOperCompletionTime.2
0

rttMonLatestRttOperCompletionTime.18
12
rttMonLatestRttOperCompletionTime.19
2
Видим: значение нашего IP SLA 2 изменилось с 1 на 0
Значит будем делать в Zabbix-е триггер, отслеживающий изменение параметра на 0.
В шаблоне устройства (мне так удобнее) создаем новый элемент данных:

Теперь создаем триггер. Данное соединение не сильно критичное, поэтому максимальная задержка сигнализации будет 70 секунд. Для того чтобы не было частых ложных сработок триггера.

Логика такая: если количество полученных нулевых значений за 70 секунд больше 1, то триггер срабатывает. То есть при выставленных замерах элемента данных 1 раз в 30 секунд, это будет означать, что два замера подряд получили нулевое значение.

Keine Kommentare:

Kommentar veröffentlichen