„Hot Spare-CPUs“ (Ersatz-Verarbeitungsprozessoren) sind redundante, voll funktionsfähige und betriebsbereite CPUs, die bei Ausfall einer Normal- oder Extra-CPU durch VM2000 automatisch zugeschaltet werden und so den Platz der ausgefallenen CPU einnehmen.
„Hot Spare-CPUs“ steigern damit die Verfügbarkeit des Betriebsmittels CPU und garantieren die Serverleistung auch bei Ausfall einer realen Normal- oder Extra-CPU.
Auf SU x86 stehen „Hot Spare-CPUs“ nicht zur Verfügung. Dort können „Cold Spare-CPUs“ konfiguriert werden, die (nach Ausfall einer CPU) beim Neustart der Server Unit in Betrieb genommen werden. Nach dem Neustart steht dann wieder die bisherige CPU-Leistung zur Verfügung. |
Ausgewählte SU /390 verfügen über eine (Standard) oder mehrere „Hot Spare-CPUs“.
Spare-CPUs werden keinem CPU-Pool zugeordnet. Sie ersetzen eine ausgefallene CPU in einem beliebigen CPU-Pool.
„Hot Spare-CPUs“ im normalen Betrieb (ohne CPU-Ausfall)
Die realen „Hot Spare-CPUs“ werden beim Hochfahren des Monitorsystems in einen betriebsbereiten Hardware-Zustand gebracht, bleiben jedoch logisch weggeschaltet. Die Anzahl der verfügbaren Spare-CPUs wird in der Meldung VMS5050
angezeigt. Die realen Spare-CPUs werden im VM2000-Betrieb bei /SHOW-VM-RESOURCES
INFORMATION=*CPU/*CONFIGURATION
angezeigt.
Jede VM erhält neben den virtuellen Normal-CPUs auch virtuelle Spare-CPUs. Die Anzahl der virtuellen Spare-CPUs entspricht der Anzahl der realen Spare-CPUs.
Gastsysteme erkennen virtuelle Spare-CPUs bei ihrem Startup. Multiprozessor-Gastsysteme lassen virtuelle Spare-CPUs weggeschaltet (Zustand OFF), da wenigstens eine weitere Normal-CPU für die Ausfallerkennung zur Verfügung steht.
Mono-Gastsysteme schalten eine Spare-CPU zu, damit das Betriebssystem den eventuellen Ausfall seiner Normal-CPU erkennt und darauf reagieren kann (Zustand SLEEP). Anzahl und Zustand virtueller Spare-CPUs werden bei /SHOW-VM-ATTRIBUTES INFORMATION=*STD/*CPU
und /SHOW-VM-RESOURCES INFORMATION=*STD/*CPU
im VM-spezifischen Teil angezeigt.
Einsatz von „Hot Spare-CPUs“ bei CPU-Ausfall
Bei Hardware-Ausfall einer realen Normal- oder Extra-CPU (Malfunction Alert, Machine Check) schaltet der VM2000-Hypervisor automatisch die defekte CPU weg und eine betriebsbereite „Hot Spare-CPU“ zu. Der Multiprozessorgrad der Server Unit bleibt dadurch unverändert. Die Spare-CPU wird dabei automatisch dem CPU-Pool zugeordnet, dem auch die ausgefallene CPU zugeordnet war.
Die defekte CPU (Zustand WFM) wird aus dem CPU-Pool, dem sie zugeordnet war, entfernt. Sie bleibt solange weggeschaltet, bis der Schaden durch einen Service-Techniker behoben ist. Sie kann nicht mit /ATTACH-VM-RESOURCES
zugeschaltet werden. Sie wird auch durch einen Neustart der Server Unit nicht wieder verfügbar. Nach Reparatur wird die CPU vom Service-Techniker wieder verfügbar gemacht. Danach ist ein Neustart nötig.
/ATTACH-VM-RESOURCES
zugeschaltet werden. Sie wird auch beim Neustart der Server Unit wieder verfügbar.Ein Gastsystem erhält vom VM2000-Hypervisor den CPU-Fehler zugestellt, wenn auf der ausgefallenen realen Normal- oder Extra-CPU zum Zeitpunkt des Ausfalls eine virtuelle CPU des Gastsystems aktiv war. Das Gastsystem schaltet dann seinerseits diese virtuelle CPU weg und dafür eine virtuelle Spare-CPU zu. Der Multiprozessorgrad und die Leistungsaufnahme einer VM wird dadurch nicht verändert.
Mono-Gastsysteme bearbeiten den CPU-Fehler auf der durch Startup bereits zugeschalteten virtuellen Spare-CPU. Mono-Gastsysteme können somit, auch nachdem sie von einem CPU-Ausfall betroffen sind, weiterarbeiten.
Das Prinzip der Spare-CPU gilt auch für das Monitorsystem. Steht bei Ausfall der einzigen betriebsbereiten virtuellen CPU im Monitorsystem keine Spare-CPU mehr zur Verfügung, wird bei gesetzter Restart-Option ein Restart des Monitorsystems durch den VM2000-Hypervisor eingeleitet.