Monitoring Linux Software Raid with Nagios

Download the check_md_raid script (http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_md_raid/details and upload it to the server you want to monitor in the following location:

root@nagios ~/plugins # scp check_md_raid root@backup:/usr/lib/nagios/plugins/
root@backup's password: 
check_md_raid                                                                 100%  782     0.8KB/s   00:00

Rediger nrpe.cfg på den maskine du ønsker at overvåge:

root@backup /etc/nagios # vim nrpe.cfg

og tilføj flg. linie:

command[check_md]=/usr/lib/nagios/plugins/check_md_raid

og genstart nrpe

root@backup ~ # /etc/init.d/nagios-nrpe-server restart
Stopping nagios-nrpe: nagios-nrpe.
Starting nagios-nrpe: nagios-nrpe.

Inden vi går videre vil jeg lige tjekke at det virker:

root@nagios ~ # /usr/lib/nagios/plugins/check_nrpe -H backup -c check_md
OK - Checked 3 arrays.

Så langt så godt, det virker jo. Derefter skal vi tilføje en service definition for vores md-tjek på nagios serveren, således at tjekket fremover kører automatisk:

root@nagios ~ # vi /etc/nagios-plugins/config/nrpe.cfg

og tilføjer flg:

define command{
        command_name    check_md
        command_line    /usr/lib/nagios/plugins/check_nrpe -H '$HOSTADDRESS$' -c check_md -u # -w 30
}

og til sidst:

root@nagios ~ # vi /etc/nagios/conf.d/backup3.cfg

og tilføj:

define service{
        use                     generic-service  
        host_name               backup 
        service_description     Software Raid
        check_command           check_md
        }

Genstart nagios:

root@nagios ~ # /etc/init.d/nagios3 restart
Restarting nagios3 monitoring daemon: nagios3
.

og på webinterfacet kan jeg nu se at testen er kørt, med success:

Hvis nu det var første gang jeg lavede det her ville jeg selvfølgelig gå ud og hive et par diske ud af maskinen og se hvad der skete, så det bør du selvfølgelig også gøre så du ved hvordan det opfører sig i tilfælde af et reelt nedbrud.

Men jeg stoler på det her, for jeg har testet det mange gange før, så jeg stopper her 😉

Dette indlæg blev udgivet i Knowledge Base, Linux, Networking, Old Base. Bogmærk permalinket.

Skriv et svar