der platte Reservereifen
Dinge, die nicht funktionieren, weil sie hochverfügbar sind.

In den 90ern hatte der Anbieter unseres Archivsystems für das Lowres-Video ein - natürlich hochverfügbares - NAS Speichersystem von einer Firma, die Einstein persönlich getauft hatte, integriert. Zwei Racks groß, nicht ganz billig und natürlich alles redundant: RAID Controller, Netzwerk, Strom. Und dann eines Tages: kein Zugriff auf die Daten, kompletter Systemausfall.
- Was war passiert?
- Der aktive RAID Controller war ausgefallen.
- Und warum hatte der zweite RAID Controller nicht übernommen?
- Tja, der war schon viel früher ausgefallen.
Was lernen wir daraus?
Man braucht auch einen Prozess, der sicherstellt, dass auch die Backup-Systeme stets einsatzbereit sind. Beim Auto heißt das, regelmäßig den Reservereifen checken. Im IT Umfeld braucht man jemand oder eher etwas, was das tut, also in der Regel ein Monitoring-System und eine Organisation, die da auch reinschaut und was tut, wenn ein Alarm kommt. Muss man nur dem erklären, der vorher schon das viele Geld für die Hochverfügbarkeit des Systems bezahlt hatte.


