Nagios und Munin – Überwachung und Statistiken zu den CIT-Servern

Nach der Migration der SOSPOS-Datenbank in die Produktivsysteme von Campus IT, war es an der Zeit, eine Überwachung der wichtigsten Dienste einzuführen.
Dafür greift Campus IT auf die bestehende Nagios-Infrastruktur zurück. Nagios überprüpft dabei in Intervallen die Verfügbarkeit und Antwortzeit der wichtigesten Dienste und warnt bei Überschreitung eines vorkonfigurierbaren Schwellwerts die Mitglieder des Teams, so dass diese gegebenenfalls eingreifen können oder aber im schlimmsten Fall zumindest Kenntnis vom Ausfall eines Systems erhalten. Von Nagios überwacht werden dabei die 4 virtuellen Maschinen der Produktivsäule, sowie die physikalischen Hosts.
Der Einsatzbereich von Munin ist die Auswertung und graphische Aufbereitung von Auslastungsdaten der Systeme und ersetzt damit cacti. Munin setzt hierbei wie Nagios auf eine Server/Agent Struktur. Dabei kümmert sich der Server um die Abholung und graphische Aufbereitung aller Daten, sowie deren Darstellung in einem Webserver, während die auf den zu überwachenden Rechnern laufenden Agents die Daten zusammentragen. Bei der Darstellung und Speicherung der gesammelten Daten greift Munin auf dabei ebenso wie cacti auf  RRDTool zurück, so dass sich die graphische Darstellung annährend unverändert ist; einzig die Anzahl erfasster Messdaten fällt umfangreicher aus. Munin sammelt Daten von allen 13 virtuellen Maschinen und den 3 physikalischen Hosts.
Zum besseren Verständniss hier noch 2 Bilder beider Tools:

Munin

Nagios