監視サーバーをAWS上で構築し、CML上のネットワーク機器/サーバーを監視します。監視ソフトウェアはZabbixを利用します。
【前回】AWS上での監視サーバー(Zabbix)構築【6.監視登録(ICMPノード監視)】
【次回】AWS上での監視サーバー(Zabbix)構築【8.監視登録(SNMP Trap)】
ネットワーク構成
下記のネットワーク環境を構築し、AWS上のEC2(Zabbixサーバー)から、CML上のネットワーク機器/サーバーを監視できるようにしていきます。
![ネットワーク構成](https://infrastructure-engineer.com/wp-content/uploads/2021/08/000-3-1024x239.png)
Zabbixの監視登録(SNMP)
前回登録したホストの設定を変更し、SNMPによるデータ取得、監視ができるようにします。今回はCPU使用率の高騰を検知できることを検証します。
「設定」→「ホスト」から、”VPN-Router”をクリックします。
![ホストの選択](https://infrastructure-engineer.com/wp-content/uploads/2021/09/001-3-1024x540.jpg)
SNMPインターフェースの「追加」をクリックします。
![SNMPインターフェースの追加](https://infrastructure-engineer.com/wp-content/uploads/2021/09/002-2-1024x852.jpg)
インターフェースのIPアドレスを入力します。
![SNMPインターフェースにIPアドレスを設定](https://infrastructure-engineer.com/wp-content/uploads/2021/09/003-3-1024x852.jpg)
“テンプレート”を選択します。前回登録した”Template Module ICMP Ping”の「リンクと保存データを削除」を実施します。※新しく設定するテンプレートにも同様の監視内容が含まれているため削除します。
![既存のテンプレートを削除](https://infrastructure-engineer.com/wp-content/uploads/2021/09/004-3-1024x404.jpg)
Zabbixの標準で用意されているCiscoのSNMPテンプレートを適用します。「新規テンプレートをリンク」に”cisco”と入力し、表示される”Template Net Cisco IOS SNMPv2″を選択します。
!["Template Net Cisco IOS SNMPv2"を選択](https://infrastructure-engineer.com/wp-content/uploads/2021/09/005-2-1024x548.jpg)
選択したテンプレートが表示されていることを確認し、「追加」をクリックします。
!["Template Net Cisco IOS SNMPv2"を追加](https://infrastructure-engineer.com/wp-content/uploads/2021/09/006-2-1024x404.jpg)
テンプレートがリンクされたことを確認します。
![テンプレートが追加されたことを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/007-2-1024x418.jpg)
“マクロ”を選択し、「継承したマクロとホストマクロ」をクリックします。
![マクロ→継承したマクロとホストマクロを選択](https://infrastructure-engineer.com/wp-content/uploads/2021/09/008-2-1024x374.jpg)
「{$SNMP_COMMUNITY}」にSNMPコミュニティ名が設定されているため、任意の値に変更します。
![デフォルトのコミュニティ名を確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/009-2-1024x852.jpg)
値を入力し、「更新」をクリックします。※ここでは、”cmlpublic”に変更しています。
![コミュニティ名を変更](https://infrastructure-engineer.com/wp-content/uploads/2021/09/010-2-1024x852.jpg)
![コミュニティ名を変更](https://infrastructure-engineer.com/wp-content/uploads/2021/09/011-2-1024x196.jpg)
ホストにテンプレートが適用されていることを確認します。
![ホストの設定が変更されたことを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/012-2-1024x539.jpg)
同様にRouter1にも”Template Net Cisco IOS SNMPv2″を適用します。
![Router1も同様に設定](https://infrastructure-engineer.com/wp-content/uploads/2021/09/013-1-1024x538.jpg)
ネットワーク機器の設定
VPN-RouterとRouter1にSNMPの設定を行います。
snmp-server community cmlpublic RO
snmp-server host 10.0.0.100 cmlpublic
“cmlpublic”の部分は、Zabbix側で設定したコミュニティ名と合わせます。
SNMPデータ取得確認
「監視データ」→「最新データ」からSNMPのデータ取得状況を確認できます。CPU等は、デフォルトのポーリング間隔が1時間となっているため、初回の取得までに少し時間がかかります。
![最新の監視データを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/014-1-1024x527.jpg)
監視確認
CPU使用率高騰が障害として検知される条件を確認します。
「設定」→「テンプレート」を選択します。
![監視設定の確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/015-1-1024x539.jpg)
名称に”Cisco IOS SNMP”を入力し適用します。表示された”Template Net Cisco IOS SNMPv2″をクリックします。
![テンプレートを選択](https://infrastructure-engineer.com/wp-content/uploads/2021/09/016-1-1024x539.jpg)
「マクロ」→「継承したマクロとテンプレートマクロ」を選択します。”{$CPU_UTIL_MAX}”の値が、CPU使用率が何%になると障害扱いとするかを表しています。
![CPU監視のデフォルトの値を確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/017-2-1024x852.jpg)
検証のために一時的に「30」に変更します。
![CPU監視の閾値を変更](https://infrastructure-engineer.com/wp-content/uploads/2021/09/018-1-1024x481.jpg)
![](https://infrastructure-engineer.com/wp-content/uploads/2021/09/019-1-1024x230.jpg)
Router1のCPU使用率を高騰させ、障害検知できることを確認します。
コンフィグ保存(write memory)を連続で実施しCPU使用率を高騰させます。
wr mem
show proc cpu | inc utilization
下記のように5分平均のCPU使用率が徐々に上昇していきます。
Router1#wr mem
Building configuration...
[OK]
Router1#show proc cpu | inc utilization
CPU utilization for five seconds: 62%/0%; one minute: 12%; five minutes: 8%
Router1#
Router1#wr mem
Building configuration...
[OK]
Router1#show proc cpu | inc utilization
CPU utilization for five seconds: 72%/0%; one minute: 16%; five minutes: 9%
Router1#
Router1#wr mem
Building configuration...
[OK]
Router1#show proc cpu | inc utilization
CPU utilization for five seconds: 87%/0%; one minute: 22%; five minutes: 11%
〜〜〜 中略 〜〜〜
Router1#wr mem
Building configuration...
[OK]
Router1#show proc cpu | inc utilization
CPU utilization for five seconds: 83%/0%; one minute: 51%; five minutes: 26%
〜〜〜 中略 〜〜〜
Router1#wr mem
Building configuration...
[OK]
Router1#show proc cpu | inc utilization
CPU utilization for five seconds: 54%/0%; one minute: 46%; five minutes: 36%
Zabbix側でもCPU使用率の変化が確認できます。ZabbixのCPU監視間隔は3分毎になっています。
![CPU使用率が上昇していることを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/020-2-1024x217.jpg)
![CPU使用率が30%を超えたことを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/021-2-1024x217.jpg)
CPU使用率が30%を超えた段階で、「監視データ」→「障害」を確認すると、”High CPU utilization(CPU使用率高騰)”として障害検知ができています。
![障害検知できていることを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/022-2-1024x279.jpg)
時間が経過し、CPU使用率が30%以下になると、障害復旧(解決済み)として扱われます。
![CPU使用率が30%以下になったことを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/023-2-1024x217.jpg)
![障害復旧を検知したことを確認](https://infrastructure-engineer.com/wp-content/uploads/2021/09/024-1-1024x279.jpg)
パケットキャプチャ確認
SNMP通信をCML上でキャプチャして確認します。
get-responseとしてCPU使用率の値を返していることがわかります。※”1.3.6.1.4.1.9.9.109.1.1.1.1.8″が、cpmCPUTotal5minRev(5分平均のCPU使用率)のOIDです。
![](https://infrastructure-engineer.com/wp-content/uploads/2021/09/025-1-1024x730.jpg)
![](https://infrastructure-engineer.com/wp-content/uploads/2021/09/026-1-1024x730.jpg)
以上で、AWS上での監視サーバー(Zabbix)構築【7.監視登録(SNMP)】の説明は完了です!
【前回】AWS上での監視サーバー(Zabbix)構築【6.監視登録(ICMPノード監視)】
【次回】AWS上での監視サーバー(Zabbix)構築【8.監視登録(SNMP Trap)】