Der Ausfall einer Knoten-Anwendung wird angenommen, wenn eine überwachte Anwendung innerhalb der konfigurierten Wartezeit und unter Berücksichtigung der konfigurierten Wiederholungsversuche nicht auf die Nachrichten antwortet, und wenn im Anschluss daran anhand der KDCFILE der überwachten Anwendung erkannt wird, dass diese Anwendung nicht mehr läuft, aber auch nicht normal beendet wurde.
Wird ein Ausfall oder eine abnormale Beendigung der überwachten Knoten-Anwendung erkannt, geht openUTM wie folgt vor:
Die Knoten-Anwendung wird in der Cluster-Konfigurationsdatei als ausgefallen gekennzeichnet und aus den Überwachungsbeziehungen ausgetragen.
Falls Sie in der UTM-Generierung ein sogenanntes Failure-Skript angegeben haben, startet die überwachende Knoten-Anwendung dieses Skript auf dem Rechner der überwachenden Knoten-Anwendung. Dem Failure-Skript werden folgende Daten der ausgefallenen Anwendung übergeben:
Anwendungsname
Basisname der Knoten-Anwendung
Rechnername
Virtual Host-Name oder Leerzeichen
Referenzname der Knoten-Anwendung
Fehlercode des UTM-Dumps (Term Application Reason)
openUTM-Handbuch „Anwendungen generieren“, CLUSTER-Anweisung
Um das Failure-Skript zu konfigurieren, geben Sie den Operanden FAILURE-CMD an. In diesem Operanden wird ein Kommando-String übergeben, der ein auszuführendes Kommando sowie Aufrufparameter enthält.Die überwachende Knoten-Anwendung startet einen Restart-Überwachungs-Timer, sofern Sie diesen konfiguriert haben:
openUTM-Handbuch „Anwendungen generieren“, CLUSTER-Anweisung
Um den Restart-Überwachungs-Timer zu konfigurieren, geben Sie den Operanden RESTART-TIMER-SEC an. Er legt die Zeit in Sekunden fest, die eine Knoten-Anwendung nach einem Ausfall maximal für einen Warm-Start benötigt.Falls Sie in der UTM-Generierung ein Emergency-Skript angegeben haben, startet die überwachende Knoten-Anwendung dieses Skript, wenn die ausgefallene Knoten-Anwendung nach Ablauf des Timers für die Restart-Überwachung nicht wieder verfügbar ist. Dem Emergency-Skript werden folgende Daten der ausgefallenen Anwendung übergeben:
Anwendungsname
Basisname der Knoten-Anwendung
Rechnername
Virtual Host-Name oder Leerzeichen
Referenzname der Knoten-Anwendung
Fehlercode des UTM-Dumps (Term Application Reason)
openUTM-Handbuch „Anwendungen generieren“, CLUSTER-Anweisung
Um das Emergency-Skript zu konfigurieren, geben Sie den Operanden EMERGENCY-CMD an. In diesem Operanden wird ein Kommando-String übergeben, der ein auszuführendes Kommando sowie Aufrufparameter enthält.
Beispiel-Skript bei Ausfallerkennung
Mit openUTM werden Beispiele für Failure- und Emergency-Skripte ausgeliefert. Die Beispiele geben beim Aufruf die übergebenen Parameter aus. Um die Beispiele in einer Produktionsumgebung einzusetzen, müssen Sie sie an die Anforderungen des betreffenden Clusters anpassen.
Unix- und Linux-Systeme
Folgende Beispiel-Skripte werden im Verzeichnis utmpfad/shsc
ausgeliefert:
utm-c.emergency
utm-c.failure
Windows-Systeme
Folgende Beispiel-Skripte werden im Verzeichnis utmpfad\shsc
ausgeliefert:
utm-c.emergency.cmd
utm-c.failure.cmd