Your Browser is not longer supported

Please use Google Chrome, Mozilla Firefox or Microsoft Edge to view the page correctly
Loading...

{{viewport.spaceProperty.prod}}

Ausfall eines Teilnehmers im Shared-Pubset-Verbund

&pagelevel(3)&pagelevel

Fällt ein am Shared-Pubset-Verbund teilnehmender Rechner aus, so kann (nach erfolgter Rekonfiguration) der Verbund von den übrigen Teilnehmern fortgesetzt werden. Hierfür ist erforderlich, dass beim Ausfall eines Slave-Rechners der Master-Rechner die Sperren des Slave-Rechners freigibt (Slave-Crash-Verarbeitung); beim Ausfall des Master-Rechners muss ein Slave-Rechner (Backup-Master) die Rolle des Master-Rechners übernehmen (Master-Wechsel-Import).
Die Mechanismen zur Ausfallerkennung sowie die beim Ausfall ergriffenen Maßnahmen hängen von den BS2000-Versionen der teilnehmenden Rechner ab. Auf die Unterschiede wird in den einzelnen Rekonfigurationsschritten eingegangen.

  1. Ausfallerkennung
    Die Überwachung und Ausfallerkennung der Partner erfolgt partnerspezifisch für alle gemeinsamen Pubsets . Für die Fehlerbehebung kann festgelegt werden, ob sie automatisch durchgeführt werden soll oder ob sie durch die Systembetreuung veranlasst werden muss.

    • Ein Partner-Rechner ist möglicherweise ausgefallen, wenn vom Rechner das Plattenprotokoll des Partners auf allen mit dem Partner-Rechner gemeinsamen Pubsets nicht mehr wahrgenommen wird und die MSCF-Verbindungsüberwachung eine Verbindungsstörung festgestellt hat bzw. keine MSCF-Verbindung aufgebaut ist.

    • Sind beide Überwachungspfade aus Sicht des Rechners fehlerfrei und sind die Lebendmeldungen des Partners auf beiden Überwachungspfaden gleichzeitig ausgeblieben (gleichzeitig im Rahmen der Intervalle der Überwachungsmechanismen) so wird der Partner automatisch als ausgefallen erklärt, wenn dies die bei „Verbot des automatischen Starts einer Fail-Rekonfiguration“ (Globale Steuerungsparameter) beschriebenen Regeln zulassen.

    In allen anderen Fällen wird eine Entscheidung der Systembetreuung (Meldung MCS1100) angefordert; erst nach Beantworten der Meldung mit „CRASH“ oder „MTERM“ (genauer „MXCM-<akz>.CRASH“ oder „MXCM-<akz>.MTERM“) wird der Partner als ausgefallen erklärt.

  2. Ausfall eines Sharers

    Gilt der Partner-Rechner als ausgefallen, so wird für die einzelnen betroffenen Pubsets die Fehlerbehandlung parallel in jeweils eigenen Tasks gestartet. Der Ausfall des Partners wird bei einer Master-Slave-Beziehung mit der Meldung DMS03B0, bei einer Slave-Slave-Beziehung mit MCA0110 auf der Bedienstation angezeigt.
    Beim Ausfall eines Slave-Rechners wird am Master-Rechner eine Slave-Crash-Verarbeitung angestoßen. An den anderen Slave-Rechnern sind keine Recovery-Maßnahmen erforderlich.
    Beim Ausfall des Master-Rechners wird einer der Slave-Rechner zum Backup Master. Der Backup Master startet einen Master-Wechsel-Import.

  3. Bestimmung des Backup Masters

    Ist der Master-Rechner ausgefallen, so bestimmt jeder Rechner den Backup Master anhand seiner lokalen Watch-Dog-Teilnehmerliste, den aktuell im SVL eingetragenen Sharern und den über das Kommando SET-PUBSET-ATTRIBUTES vergebenen Steuerparametern für den Master-Wechsel.
    Ist der Rechner selbst Backup Master, so prüft er, ob ein Master-Wechsel durchgeführt werden kann. Ist ein Master-Wechsel nicht möglich (z. B. Verbindung zu einem Slave-Rechner ist nicht aufgebaut), so wird er mit der Meldung MCA0104 abgelehnt. Andernfalls wird ein Master-Wechsel-Import gestartet.
    Ist der Rechner nicht der Backup Master, so wartet er auf den Start des Master-Wechsel-Imports auf dem Backup Master. Sollte zum Backup Master jedoch keine Verbindung bestehen, kann der Master-Wechsel nicht durchgeführt werden (Meldung MCA0104 wird ausgegeben).

  4. Master-Wechsel-Import

    Beim Master-Wechsel-Import müssen die einzelnen DVS-Komponenten (z.B CMS, Allocator) ihre Master-Instanz auf dem neuen Master-Rechner aufbauen. Hierbei müssen auch die verloren gegangen Verwaltungsdaten in Kooperation mit den Slave-Instanzen auf den anderen Teilnehmern des Shared-Pubset-Verbunds rekonstruiert werden. Während des Master-Wechsel-Imports werden alle neuen Anforderungen an den Master-Rechner zurückgestellt, bis der Master-Wechsel vollzogen oder abgebrochen ist.

  5. Slave-Crash-Verarbeitung

    Der Master-Rechner gibt alle vom Slave-Rechner gehaltenen Betriebsmittel frei. Alle Sperren (Datei- und Katalogeintrags-Locks) werden zurückgesetzt.

Die Meldung MCS1100 wird auf allen betroffenen Rechnern ausgegeben, die den Ausfall des Partners bemerkt haben. Die Meldung muss nur auf einem Rechner beantwortet werden. Diese Antwort gilt für den gesamten Verbund.