Zur ständigen Überwachung der Shared-Pubset-Konfiguration ist es erforderlich, dass das Plattenprotokoll kontinuierlich geschrieben und gelesen wird (vgl. "Shared-Pubset-Verbund"). Ein-/Ausgabe-Fehler beim Zugriff auf die Platte bedeuten deshalb eine Einschränkung der Überwachungs- und Rekonfigurationsfähigkeit des Shared-Pubset-Verbunds. Die Verwendung mehrerer Shared-Pubsets erhöht die Robustheit der Plattenüberwachung bei Plattenfehlern.
Der Überwachungsmechanismus toleriert die Störung eines Überwachungspfades. Das gleichzeitige Auftreten eines Fehlers auf dem anderen Überwachungspfad (hier Verbindungsverlust) kann jedoch Ursache für eine fehlerhafte Ausfallerkennung des Rechners durch die Partner sein. Notfallmaßnahmen (entweder sofortiger Export oder Systembeendigung durch MSCF) sind in diesem Fall unvermeidlich.
Bei Ein-/Ausgabe-Fehlern ist zwischen temporären und permanenten (d.h. nicht behebbaren) Fehlern zu unterscheiden. Ein temporärer Ein-/Ausgabe-Fehler kann eine verzögert beendete Ein-/Ausgabe-Operation oder ein vom System automatisch behobener Ein-/Ausgabe-Fehler sein. Das Lesen und Beschreiben der Watch-Dog-Datei wird nicht eingestellt, sondern periodisch weiter versucht. Mit Behebung des E/A-Fehlers ist auch die Störung des Plattenpfades beseitigt.
Ein permanenter Ein-/Ausgabe-Fehler, also ein nicht behebbarer Fehler, kann nur durch Eingriffe der Systembetreuung (und mit eventuellen Hardware-Reparaturen) behoben werden. Der Pubset wird in den Zustand WRTERR bzw. READERR versetzt (das Kommando SHOW-SHARED-PUBSET Informationen über Shared-Pubsets anfordern informiert über die Plattenzustände). Beim permanenten Ein-/Ausgabe-Fehler sollte der Pubset möglichst bald exportiert und erst nach der Behebung des Fehlers erneut importiert werden.
Fehler beim Schreiben der Lebendmeldungen
Ein Schreibfehler beim Zugriff eines Sharers auf die Watch-Dog-Datei des Shared-Pubsets beeinträchtigt die Rekonfigurationsfähigkeit des Verbunds. Ein Master-Wechsel kann nicht durchgeführt werden, bei einem XCS-Pubset können darüber hinaus Leave- oder Fail-Rekonfigurationen blockiert sein. Außerhalb der Rekonfiguration hat ein Schreibfehler für sich alleine keine weiteren Folgen. Ein gleichzeitiger Ausfall der Kommunikation mit dem Partner bringt jedoch die Gefahr einer fehlerhaften Ausfallerkennung mit sich und macht Notfallmaßnahmen erforderlich. Diese hängen von der auf dem Partner-Rechner ablaufenden BS2000-Version ab.
Die Sharer unterliegen der partnerbezogenen Ausfallüberwachung. Ein Schreibfehler beim Schreiben in die Watch-Dog-Datei eines Shared-Pubsets wirkt sich hier erst dann auf die Überwachung aus, wenn er bei allen mit einem Partner gemeinsam genutzten Pubsets auftritt.
Sollte in einer solchen Situation im engen zeitlichen Zusammenhang auch die MSCF-Verbindung zum Partner ausfallen, so droht, abhängig von den RECOVERY-START-Einstellungen, eine fehlerhafte Ausfallerkennung durch den Partner. MSCF wird gegebenenfalls zur Vermeidung der fehlerhaften Ausfallerkennung eine Systembeendigung einleiten und die Meldung MCS1300 ausgeben.
Über Schreibfehler wird mit der Meldung DMS03B9 informiert. Die Behebung wird über die Meldung DMS03BB mitgeteilt.
Am Partner wird das Auftreten und Beheben eines Schreibfehlers mit der Meldung MCA0110 bekannt gegeben.
Fehler beim Lesen der Lebendmeldungen
Kann ein Sharer infolge eines Lese-Fehlers die von den Partnern in der Watch-Dog-Datei hinterlegten Lebendmeldungen nicht mehr lesen, so kann er einen eventuellen Ausfall dieser Partner nicht erkennen. Ist auf Grund des Lesefehlers und einer ausgefallenen MSCF-Verbindung ein Partner für die Konfigurationsverwaltung nicht mehr als aktiv sichtbar, so ist der Partner möglicherweise ausgefallen. Eine diesbezügliche Entscheidung der Systembetreuung wird unabhängig von den RECOVERY-START-Einstellungen angefordert (Meldung MCS1100).
Der Lesefehler wird über die Meldung DMS03B2 angezeigt, die Behebung des Lesefehlers über die Meldung DMS03B8. Ist ein als ausgefallen verdächtigter Partner wieder als aktiv erkennbar, so wird die Ausfallfrage zurückgezogen.