Download the check_md_raid script (http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_md_raid/details and upload it to the server you want to monitor in the following location:
root@nagios ~/plugins # scp check_md_raid root@backup:/usr/lib/nagios/plugins/ root@backup's password: check_md_raid 100% 782 0.8KB/s 00:00
Rediger nrpe.cfg på den maskine du ønsker at overvåge:
root@backup /etc/nagios # vim nrpe.cfg
og tilføj flg. linie:
command[check_md]=/usr/lib/nagios/plugins/check_md_raid
og genstart nrpe
root@backup ~ # /etc/init.d/nagios-nrpe-server restart Stopping nagios-nrpe: nagios-nrpe. Starting nagios-nrpe: nagios-nrpe.
Inden vi går videre vil jeg lige tjekke at det virker:
root@nagios ~ # /usr/lib/nagios/plugins/check_nrpe -H backup -c check_md OK - Checked 3 arrays.
Så langt så godt, det virker jo. Derefter skal vi tilføje en service definition for vores md-tjek på nagios serveren, således at tjekket fremover kører automatisk:
root@nagios ~ # vi /etc/nagios-plugins/config/nrpe.cfg
og tilføjer flg:
define command{ command_name check_md command_line /usr/lib/nagios/plugins/check_nrpe -H '$HOSTADDRESS$' -c check_md -u # -w 30 }
og til sidst:
root@nagios ~ # vi /etc/nagios/conf.d/backup3.cfg
og tilføj:
define service{ use generic-service host_name backup service_description Software Raid check_command check_md }
Genstart nagios:
root@nagios ~ # /etc/init.d/nagios3 restart Restarting nagios3 monitoring daemon: nagios3 .
og på webinterfacet kan jeg nu se at testen er kørt, med success:
Hvis nu det var første gang jeg lavede det her ville jeg selvfølgelig gå ud og hive et par diske ud af maskinen og se hvad der skete, så det bør du selvfølgelig også gøre så du ved hvordan det opfører sig i tilfælde af et reelt nedbrud.
Men jeg stoler på det her, for jeg har testet det mange gange før, så jeg stopper her 😉