Your Browser is not longer supported

Please use Google Chrome, Mozilla Firefox or Microsoft Edge to view the page correctly
Loading...

{{viewport.spaceProperty.prod}}

Hochverfügbarkeit durch „Hot Spare-CPUs" (SU /390)

&pagelevel(5)&pagelevel

„Hot Spare-CPUs“ (Ersatz-Verarbeitungsprozessoren) sind redundante, voll funktionsfähige und betriebsbereite CPUs, die bei Ausfall einer Normal- oder Extra-CPU durch VM2000 automatisch zugeschaltet werden und so den Platz der ausgefallenen CPU einnehmen.

„Hot Spare-CPUs“ steigern damit die Verfügbarkeit des Betriebsmittels CPU und garantieren die Serverleistung auch bei Ausfall einer realen Normal- oder Extra-CPU.

Auf SU x86 stehen „Hot Spare-CPUs“ nicht zur Verfügung.

Dort können „Cold Spare-CPUs“ konfiguriert werden, die (nach Ausfall einer CPU) beim Neustart der Server Unit in Betrieb genommen werden. Nach dem Neustart steht dann wieder die bisherige CPU-Leistung zur Verfügung.

Ausgewählte SU /390 verfügen über eine (Standard) oder mehrere „Hot Spare-CPUs“.

Spare-CPUs werden keinem CPU-Pool zugeordnet. Sie ersetzen eine ausgefallene CPU in einem beliebigen CPU-Pool.


„Hot Spare-CPUs“ im normalen Betrieb (ohne CPU-Ausfall)

Die realen „Hot Spare-CPUs“ werden beim Hochfahren des Monitorsystems in einen betriebsbereiten Hardware-Zustand gebracht, bleiben jedoch logisch weggeschaltet. Die Anzahl der verfügbaren Spare-CPUs wird in der Meldung VMS5050 angezeigt. Die realen Spare-CPUs werden im VM2000-Betrieb bei /SHOW-VM-RESOURCES
INFORMATION=*CPU/*CONFIGURATION angezeigt.

Jede VM erhält neben den virtuellen Normal-CPUs auch virtuelle Spare-CPUs. Die Anzahl der virtuellen Spare-CPUs entspricht der Anzahl der realen Spare-CPUs.

Ist die Summe (virtuelle Normal-CPUs + Spare-CPUs) größer als 16, also größer als der maximal erlaubte Multiprozessorgrad einer VM, so verringert sich die Anzahl der virtuellen Spare-CPUs der VM entsprechend.

Gastsysteme erkennen virtuelle Spare-CPUs bei ihrem Startup. Multiprozessor-Gastsysteme lassen virtuelle Spare-CPUs weggeschaltet (Zustand OFF), da wenigstens eine weitere Normal-CPU für die Ausfallerkennung zur Verfügung steht.

Mono-Gastsysteme schalten eine Spare-CPU zu, damit das Betriebssystem den eventuellen Ausfall seiner Normal-CPU erkennt und darauf reagieren kann (Zustand SLEEP). Anzahl und Zustand virtueller Spare-CPUs werden bei /SHOW-VM-ATTRIBUTES INFORMATION=*STD/*CPU und /SHOW-VM-RESOURCES INFORMATION=*STD/*CPU im VM-spezifischen Teil angezeigt.


Einsatz von „Hot Spare-CPUs“ bei CPU-Ausfall

Bei Hardware-Ausfall einer realen Normal- oder Extra-CPU (Malfunction Alert, Machine Check) schaltet der VM2000-Hypervisor automatisch die defekte CPU weg und eine betriebsbereite „Hot Spare-CPU“ zu. Der Multiprozessorgrad der Server Unit bleibt dadurch unverändert. Die Spare-CPU wird dabei automatisch dem CPU-Pool zugeordnet, dem auch die ausgefallene CPU zugeordnet war.

Die defekte CPU (Zustand WFM) wird aus dem CPU-Pool, dem sie zugeordnet war, entfernt. Sie bleibt solange weggeschaltet, bis der Schaden durch einen Service-Techniker behoben ist. Sie kann nicht mit /ATTACH-VM-RESOURCES zugeschaltet werden. Sie wird auch durch einen Neustart der Server Unit nicht wieder verfügbar. Nach Reparatur wird die CPU vom Service-Techniker wieder verfügbar gemacht. Danach ist ein Neustart nötig.

Sonstige Ausfälle von Normal- oder Extra-CPUs (z.B. CPU-Hänger) führen zum Wegschalten der CPU (Zustand ERR). Es wird aber keine Spare-CPU zugeschaltet. Die ausgefallene CPU kann mit /ATTACH-VM-RESOURCES zugeschaltet werden. Sie wird auch beim Neustart der Server Unit wieder verfügbar.

Ein Gastsystem erhält vom VM2000-Hypervisor den CPU-Fehler zugestellt, wenn auf der ausgefallenen realen Normal- oder Extra-CPU zum Zeitpunkt des Ausfalls eine virtuelle CPU des Gastsystems aktiv war. Das Gastsystem schaltet dann seinerseits diese virtuelle CPU weg und dafür eine virtuelle Spare-CPU zu. Der Multiprozessorgrad und die Leistungsaufnahme einer VM wird dadurch nicht verändert.

Mono-Gastsysteme bearbeiten den CPU-Fehler auf der durch Startup bereits zugeschalteten virtuellen Spare-CPU. Mono-Gastsysteme können somit, auch nachdem sie von einem CPU-Ausfall betroffen sind, weiterarbeiten.

Das Prinzip der Spare-CPU gilt auch für das Monitorsystem. Steht bei Ausfall der einzigen betriebsbereiten virtuellen CPU im Monitorsystem keine Spare-CPU mehr zur Verfügung, wird bei gesetzter Restart-Option ein Restart des Monitorsystems durch den VM2000-Hypervisor eingeleitet.