Seit heute kann unser Nagios bei Systemstörungen ein Ticket im OTRS eröffnen und auch wieder schließen, wenn die Störung vorbei ist. Im Gegenzug hat OTRS gelernt, die Störung im Nagios zu acknowledgen, wenn das Ticket zur Bearbeitung geöffnet wird.
Zunächst wird im OTRS in der Paketverwaltung das Modul "System Monitoring" installiert. Die Konfiguration besteht aus zwei Teilen, dem E-Mail Script, das eingehende Mails von Nagios interpretiert und dem Acknowledge Teil, der im Nagios die Störung acknowledged.
Nagios wird nun so eingestellt, daß er alle, oder auch nur ausgewählte Alarme an eine Mailbox sendet, die von OTRS ausgelesen wird (Nagios contacts.cfg). OTRS wird nun der Absender der E-Mails mitgeteilt ("FromAddressRegExp" in "PostMaster::PreFilterModule###1-SystemMonitoring"):
Wenn im Nagios alles standardmäßig konfiguriert ist, dann hat OTRS schon alle Parameter per Default dabei, um aus dem nächsten eingehenden Mail von Nagios ein Ticket zu erstellen, hier habe ich einfach einen Service auf einem überwachten System gestoppt, Nagios hat die E-Mail Notification an OTRS gesendet und OTRS hat ein Ticket eröffnet und sogar die beiden freien Felder "Host" und "Service" gefüllt:
Nun wird das Acknowledgement konfiguriert, hier gibt es zwei Möglichkeiten, per HTTP oder per Named Pipe. Da unser OTRS Server und der Nagios Server durch einige Firewalls getrennt sind, benutze ich die HTTP Methode. Diese wird eingestellt und es wird die URL zum Nagios System und User und Passwort angegeben:
Wichtig: Die beiden freien Felder, in die OTRS den Host und den betroffenen Service einträgt, sollte man nicht verändern, sonst klappt das Acknowledgement nicht!
Wird nun im OTRS das Ticket gesperrt
dann wird der Alarm sofort im Nagios acknowledged:
Ist die Notification im OTRS aktiviert, dann erhält der zuständige Techniker natürlich auch die Nachricht, über das neue Ticket, aber auch über das Acknowledgement:
Das Acknowledgement wird natürlich auch in das Ticket hineingefügt, so daß man den gesamten Verlauf des Problemes schön dokumentiert hat:
Wenn das Problem dann behoben ist, schickt Nagios die RECOVERY Meldung per E-Mail und OTRS schließt automatisch das Ticket:
Auch darüber wird man, bei aktivierter Benachrichtigung, per Mail informiert, weil das Recorverymail ja zunächst eine Nachfrage ist:
Variationen sind leicht möglich, durch verschiedene Contacts im Nagios, welche dann die Mails an verschiedene Adressen senden und somit in verschiedene OTRS Queues einsortieren, ich empfehle natürlich immer, das System so simpel, wie möglich, zu halten!
Nachtrag: Seit 24.12.2012 ist unser eigenes OTRS System nicht mehr aktiv. Details zum Warum und Wie hier.
November 30th, 2011 at 06:55
Danke für die tolle Anleitung, perfekt!
November 30th, 2012 at 12:38
“Im Gegenzug hat OTRS gelernt, die Störung im Nagios zu acknowledgen, wenn das Ticket zur Bearbeitung geöffnet wird.”
Wirklich?! “Zu acknowledgen”?!!!!
Dezember 2nd, 2012 at 08:04
Wie wärs, wenn Du den Artikel weiterliest? Ich hab sogar genau beschrieben, wie man das einrichtet. Und, wie alles auf meinem Blog: Es funktioniert. Ich sperre das OTRS Ticket und in diesem Moment setzt OTRS dieses Problem in Nagios aus Acknowledged.