Wednesday, September 8th 2010, 2:46am UTC+2
You are not logged in.
Birthday: Mar 25th 1961 (49)
Gender: male
Location: D
Occupation: Sysadmin
Number of Nagios server: 4
Nagios Versions: 2.5
Icinga-Version(en): 1.0.1
Distributed monitoring: Ja
Redundant monitoring: Nein
Number of hosts: 400
Number of services: 2000
OS: SuSE Linux
Plugin Versions: 1.4.1
Other Addons: Nagios Grapher
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG
Quoted
@ Lars,
läuft Deine Vermutung betreffend dem gleichzeitigen reboot vieler Maschinen nach dem Update auf ein Timingproblem hinaus? So nach dem Motto: Einige der vielen Einträge gehen verloren weil Nagios zu beschäftigt ist? Ansonsten sollte es doch der Policy und dem Script gleich sein, wer den reboot auslöst?
Quoted
Original von Pöler
Hallo ottl05,
sorry, ich war ein paar Tage im Urlaub, daher erst jetzt:
Also, das das Eintragen der korrekten Downtime nur manchmal klappt habe ich Anfangs auch vermutet. Der Grund war schlicht, das ich bei meinen Tests erst übersehen hatte das Downtimes, die manuell über die Weboberfläche eingetragen wurden korrekt waren, die per Script an Nagios übermittelten wegen des falschen Datumsformats aber immer in 2008 lagen.
Das in einigen Konfigurationsdateien wie auch in der nagios.cfg hinter einer Anweisung kein Kommentar stehen darf wusste ich bis dahin nicht. Das Problem war einfach meine Angewohnheit den Originalwert auszukommentieren und in der gleichen Zeile stehen zu lassen.
Seit ich das geändert habe funktioniert das Downtime Script reproduzierbar.
Ich habe allerdings auf meinen Windows Rechnern eine lokale Gruppenrichtlinie hinzugefügt, die beim herunterfahren das Script aktiviert. Damit bin ich nicht gezwungen das Script (mit dem unverschlüsselten) Passwort auf unserem DC zu hinterlegen. Unsere Oberadmins in USA müssen ja nicht alles wissen ;-)
@ Lars,
läuft Deine Vermutung betreffend dem gleichzeitigen reboot vieler Maschinen nach dem Update auf ein Timingproblem hinaus? So nach dem Motto: Einige der vielen Einträge gehen verloren weil Nagios zu beschäftigt ist? Ansonsten sollte es doch der Policy und dem Script gleich sein, wer den reboot auslöst?
Gruß
Horst
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG
Beginner
Gender: male
Location: Hamburg
Occupation: Sys-Admin
Number of Nagios server: 3
Nagios Versions: 2.5
Distributed monitoring: Ja
Redundant monitoring: Ja
Number of hosts: 375
Number of services: 1600
OS: debian sarge
Plugin Versions: 1.4.4
Other Addons: nagtrap 0.1.0, monarch 2.0.2, pnp 0.3
|
|
Source code |
1 2 3 4 5 6 7 8 9 10 11 |
--- nagios_downtime.pl.orig 2007-04-27 14:45:48.000000000 +0200
+++ nagios_downtime.pl 2007-04-27 14:46:17.000000000 +0200
@@ -166,7 +166,7 @@
}
# Only try to auth if auth informations given
- if($nagiosAuthName eq "" && $nagiosUserPw eq "") {
+ if($nagiosAuthName ne "" && $nagiosUserPw ne "") {
# submit auth informations
$oBrowser->credentials($nagiosWebServer.':'.$nagiosWebPort, $nagiosAuthName, $nagiosUser => $nagiosUserPw);
}
|
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG
Beginner
Number of Nagios server: 1
Nagios Versions: 3.2.0
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 87
Number of services: 712
OS: Debian
Plugin Versions: 1.4.14
NDO Version: 1
)Gender: male
Location: Nähe Frankfurt
Occupation: Sys-Admin
Number of Nagios server: 1
Nagios Versions: 3.1.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: ~ 220
Number of services: ~ 2100
OS: Debian Etch
Plugin Versions: 1.4.9 & 1.4.12
NagVis Version: 1.3
NDO Version: 1.4b7
Other Addons: PnP SVN_636, SNMPTT 0.1.2, NagTrap 0.1.3, DokuWiki, SMSTools
jaFunktioniert das Script auch mit Nagios 3? Denn das ist genau das was wir brauchen, da wir dauernd Meldungen während der Sicherung bekommen...
nein... die eingetragene Downtime läuft "gnadenlos" weiter. Das Skript macht ja nichts anderes als wenn Du über die Nagios-Web-Oberfläche eine Downtime einträgst.Und was genau passiert wenn der Dienst vor Ablauf der Downtime wieder verfügbar ist? Merkt Nagios das? Wird die Downtime dann automatisch beendet?
Beginner
Number of Nagios server: 1
Nagios Versions: 3.2.0
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 87
Number of services: 712
OS: Debian
Plugin Versions: 1.4.14
NDO Version: 1
Gender: male
Number of Nagios server: 2
Nagios Versions: 3.2.1
Icinga-Version(en): Icinga 1.0.1
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: >70
Number of services: >200
OS: SLES10
Plugin Versions: 1.4.11
NagVis Version: 1.4.5
NDO Version: 1.4b7
Other Addons: NRPE 2.6, NSCA 2.7, PNP 0.4.14 / 0.6
im Prinzip ja
Quoted
Gibt es dann eine Möglichkeit Nagios automatisiert vorzeitig wieder mitzuteilen, dass die downtime beendet ist?
Beginner
Number of Nagios server: 1
Nagios Versions: 3.2.0
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 87
Number of services: 712
OS: Debian
Plugin Versions: 1.4.14
NDO Version: 1
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG
Wäre es möglich das in das Script noch einzubauen?
Beginner
Number of Nagios server: 5
Nagios Versions: 2,3
Distributed monitoring: Ja
Redundant monitoring: Nein
Number of hosts: 60
Number of services: 100
OS: Solaris,Linux,Windows
Plugin Versions: 1
NDO Version: 5
im Prinzip ja
Quoted
Gibt es dann eine Möglichkeit Nagios automatisiert vorzeitig wieder mitzuteilen, dass die downtime beendet ist?
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG
Quoted
Nur wie kommt mann, aehh Script an die downtime_id ? ;-)
Gender: male
Location: Geilenkirchen
Occupation: Informationstechnischer Assistent und Auszubildender (FiSi)
Number of Nagios server: 1
Nagios Versions: 3.2.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 17
Number of services: 43
OS: RHEL 5.4
Plugin Versions: nagios-plugins-1.4.14, nrpe-2.12, check_oracle_health-1.6.4
Other Addons: NSClient++ 0.3.8, Oracle InstantClient_11_2
Number of Nagios server: 2-5
Nagios Versions: 1-3
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 80-200
Number of services: 860-2000
OS: Linux
Plugin Versions: Whatever I can download, patch, or cobble together myself :-)
32 Bit Timestamps sollten bis Anfang 2038 reichen. Wieviel Resturlaub hast Du denn ... ?Kann man eigentlich auch eine unbegrenzte Sheduled Downtime setzten?
Gender: male
Location: Geilenkirchen
Occupation: Informationstechnischer Assistent und Auszubildender (FiSi)
Number of Nagios server: 1
Nagios Versions: 3.2.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 17
Number of services: 43
OS: RHEL 5.4
Plugin Versions: nagios-plugins-1.4.14, nrpe-2.12, check_oracle_health-1.6.4
Other Addons: NSClient++ 0.3.8, Oracle InstantClient_11_2
Kann man dem Script eigentlich auch sagen, dass er für jeden Service, der dem Host zugewiesen ist, auch eine Downtime setzt?
Ich will ja nicht jeden einzelnen Service mit -s <service> hinzufügen...
This post has been edited 1 times, last edit by "Eyrax" (Jul 30th 2010, 2:27pm)
Gender: male
Location: Geilenkirchen
Occupation: Informationstechnischer Assistent und Auszubildender (FiSi)
Number of Nagios server: 1
Nagios Versions: 3.2.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 17
Number of services: 43
OS: RHEL 5.4
Plugin Versions: nagios-plugins-1.4.14, nrpe-2.12, check_oracle_health-1.6.4
Other Addons: NSClient++ 0.3.8, Oracle InstantClient_11_2
|
|
Source code |
1 |
touch /var/lock/subsys/nagios_downtime |
Quoted from "Linux (Studentenausgabe) von Michael Kofler - Installation, Konfiguration, Anwendung, 8., überarbeitete und erweiterte Ausgabe"
Bei einem Runlevel-Wechsel werden nur solche Funktionen gestoppt, die im vorigen Runlevel gestartet wurden, im neuen Runlevel aber nicht mehr benötigt werden. Ebenso werden nur solche Funktionen neu gestartet, die bisher noch nicht aktiv waren. Um das festzustellen, wird beim Start jedes Systemprozesses eine Datei in /var/lock/subsys angelegt. Diese wird beim Ende des Prozesses wieder gelöscht. [...]
Bei Debian überprüft das Script rc, ob es für die Funtkion im vorherigen Level einen Start- oder Stop-Link gibt. [...]
SuSe testet bei einem Runlevel-Wechsel durch einen Vergleich der Verzeichnisse /etc/init.d/rcneu.d und rcalt.d, welche Funktionen sich durch den Runlevel-Wechsel ändern. [...]
|
|
Source code |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 |
#!/bin/sh
# Copyright (c) 2008-2009 Lars Michelsen <lars@vertical-visions.de>
# All rights reserved.
#
# Author: Lars Michelsen <lars@vertical-visions.de>
#
# chkconfig: 345 99 01
# description: Schedules a downtime in Nagios
#
### BEGIN INIT INFO
# Provides: nagios_downtime
# Required-Start: $network
# Required-Stop:
# Default-Start: 3 4 5
# Default-Stop: 0 1 2 6
# Short-Description: nagios_downtime schedules a downtime to Nagios
# Description: The nagios_downtime script schedules a downtime
# to the specified Nagios host. The downtime script needs HTTP-access
# to the Nagios cmd.cgi to be able to post a downtime.
### END INIT INFO
BAR_BIN=/usr/bin/nagios_downtime
#BAR_BIN=./nagios_downtime
# Source function library, for e.g. echo_success or echo_failure
. /etc/rc.d/init.d/functions
# Check for missing binaries
test -x $BAR_BIN || {
echo "$BAR_BIN not installed";
if [ "$1" = "stop" ]; then
exit 0;
else
exit 5;
fi;
}
case "$1" in
stop)
echo -n "Scheduling Nagios downtime (nagios_downtime)... "
$BAR_BIN
if [ $? -eq 0 ]; then
rm -f /var/lock/subsys/nagios_downtime
echo_success
echo "done."
exit 0
else
rm -f /var/lock/subsys/nagios_downtime
echo_failure
echo "ERROR"
exit 1
fi
;;
start)
echo -n "Removing Nagios downtime (nagios_downtime)... "
$BAR_BIN -m del
if [ $? -eq 0 ]; then
touch /var/lock/subsys/nagios_downtime
echo_success
echo "done."
exit 0
else
touch /var/lock/subsys/nagios_downtime
echo_failure
echo "ERROR"
exit 1
fi
;;
status)
echo -n "Script only running while start or stop the System..."
;;
*)
# If no parameters are given, print which are avaiable
echo "Usage: $0 {stop|start}"
exit 1
;;
esac
|

|
|
Source code |
1 |
chkconfig --add nagios_downtime |
Birthday: Sep 22nd
Gender: male
Location: München
Occupation: Systemadministrator
Number of Nagios server: 1
Nagios Versions: 3.2
Distributed monitoring: Nein
Redundant monitoring: Nein
Number of hosts: 500
Number of services: 2300
OS: SLES10/64
Plugin Versions: 1.4.8
NagVis Version: Trunk
NDO Version: -
Perfparse Version: -
Other Addons: PNP (SVN), SNMPTT, SYSLOG-NG