Your Browser is not longer supported

Please use Google Chrome, Mozilla Firefox or Microsoft Edge to view the page correctly
Loading...

{{viewport.spaceProperty.prod}}

Aufträge wiederherstellen nach einem Host-Ausfall (Recovery)

&pagelevel(4)&pagelevel

HSMS unterstützt das implizite und explizite Wiederherstellen von Aufträgen.

Implizites Wiederherstellen

Beim impliziten Wiederherstellen wird versucht, die Auftragsdatei zu bereinigen. Grundsätzlich werden folgende Tätigkeiten an den Aufträgen durchgeführt:

Das implizite Wiederherstellen von Aufträgen erfolgt zu Beginn einer HSMS-Session.

Bei einer SF-Umgebung geschieht das implizite Wiederherstellen bei jedem Erzeugen des Subsystems. Es werden alle Aufträge bearbeitet, die sich in der globalen HSMS-Auftragsdatei befinden.

Aufträge mit dem Status COMPLETED werden entsprechend dem Wert von KEEP-REQUESTS gelöscht. Der Wert von KEEP-REQUESTS kann mit dem Kommando MODIFY-HSMS-PARAMETERS geändert werden. Standardmäßig ist der Wert *YES (40 Tage).

Bei einer SM-Umgebung geschieht das implizite Wiederherstellen bei jedem Startup des SM-Pubsets, d.h. beim Import des Pubsets oder beim Erzeugen des Subsystems, wenn auf den SM-Pubset zugegriffen werden konnte. Beim impliziten Wiederherstellen wird der Sperrmechanismus berücksichtigt: Ein fremder Host kann keinen Auftrag aktualisieren, der durch einen anderen Host gesperrt ist. Dies bedeutet, dass ein implizites Wiederherstellen eines SM-Pubsets lediglich ein „host-lokales“ Wiederherstellen ist.

Explizites Wiederherstellen

Im Rahmen des HIPLEX-Konzepts (siehe Abschnitt „HIPLEX und HSMS“) unterstützt HSMS einen expliziten Mechanismus zum erweiterten Wiederherstellen von Aufträgen. Dieser Mechanismus steht aber nur für Umgebungen mit SM-Pubsets zur Verfügung. Durch das explizite Wiederherstellen kann HSMS Host-Ausfällen und Host-Rekonfigurationen innerhalb von SM-Pubsets entgegenwirken.

Beim expliziten Wiederherstellen wird auf Aufträge zugegriffen, die durch einen anderen Host gesperrt sind. In der Regel befindet sich dieser ferne Host nicht mehr in der SM-Pubset-Konfiguration. Ursache dafür kann ein normaler Export oder ein System-Ausfall sein. Es besteht die Möglichkeit, dass in der Auftragsdatei noch Aufträge enthalten sind, die durch den fernen Host gesperrt sind.

Das explizite Wiederherstellen steht nur dem HSMS-Administrator auf dem Master-Sharer des SM-Pubsets zur Verfügung. Der HSMS-Administrator leitet es auf der Basis eines SM-Pubsets und eines Host-Namens ein, wenn er die Notwendigkeit dafür sieht. Ein ganz gewöhnlicher Grund dafür könnte sein, dass der ferne Host die SM-Pubset-Konfiguration nicht innerhalb einer angemessenen Zeitspanne wiederherstellen kann.

Beim expliziten Wiederherstellen wird überprüft, ob der wiederherzustellende Host ein aktiver Sharer des SM-Pubsets ist. Wenn dies der Fall ist, wird das Wiederherstellen zurückgewiesen. Bei einem exklusiven SM-Pubset wird dies dadurch erreicht, dass der Host selbst vom Wiederherstellen ausgeschlossen wird. Bei Shared-SM-Pubsets wird dies durch Aufruf der MSCF-Überwachungstask erreicht, die alle aktiven Sharern aller Shared-SM-Pubsets laufend überwacht. Wenn die Verbindung zur Überwachungstask abbricht, wird das Wiederherstellen ebenfalls zurückgewiesen.

Mit dem Operanden FORCE der Anweisung RECOVER-REQUESTS kann die Überprüfung unterdrückt werden. Dies kann sinnvoll sein, wenn der wiederherzustellende Host immer noch aktiv ist, aber keine HSMS-Tätigkeiten für den angegebenen SM-Pubset zeigt. Generell ist es nicht empfehlenswert, das Wiederherstellen eines Sharers zu erzwingen, weil das Wiederherstellen

  • Bearbeitungssperren beseitigt

  • einige Aufträge zweimal starten könnte

  • Inkonsistenzen im Archivverzeichnis zur Folge haben könnte.

Durch das Wiederherstellen wird jeder Auftrag, der durch einen Host gesperrt ist, normalisiert. Die Sperre wird aufgehoben und der Auftrag wird in Abhängigkeit von seinem Status geändert, ähnlich wie beim impliziten Wiederherstellen:

  • Aufträge mit dem Status ACCEPTED werden am lokalen Host reaktiviert, wobei eine neue Sperre gesetzt wird.

  • Aufträge mit Concurrent Copy, die den Status ACCEPTED haben und keine SHC-OSD-Spiegelungsfunktionen benutzen, erhalten den Status CANCELLED.

  • Aufträge mit dem Status STARTED erhalten den Status INTERRUPTED.

  • Aufträge mit dem Status STARTED, die nicht erneut gestartet werden können, erhalten den Status COMPLETED.

Nach dem Wiederherstellen kann auf die entsperrten Aufträge von jedem Sharer aus zugegriffen werden. Aufträge mit dem Status INTERRUPTED können von jedem Sharer erneut gestartet werden. Aufträge mit dem Status INTERRUPTED, COMPLETED oder CANCELLED können von jedem Sharer gelöscht werden.

Beim Ausfall von zwei Hosts – beispielsweise Master und ein Slave – kann für jeden Host ein explizites Wiederherstellen auf dem neuen Master-Host angefordert werden. Dabei hat die Reihenfolge des Wiederherstellens keinen Einfluss auf das Ergebnis.