der platte Reservereifen

Michael Dirk • 20. August 2023

Dinge, die nicht funktionieren, weil sie hochverfügbar sind.

In den 90ern hatte der Anbieter unseres Archivsystems für das Lowres-Video ein - natürlich hochverfügbares - NAS Speichersystem von einer Firma, die Einstein persönlich getauft hatte, integriert. Zwei Racks groß, nicht ganz billig und natürlich alles redundant: RAID Controller, Netzwerk, Strom. Und dann eines Tages: kein Zugriff auf die Daten, kompletter Systemausfall.


  • Was war passiert?
  • Der aktive RAID Controller war ausgefallen.
  • Und warum hatte der zweite RAID Controller nicht übernommen?
  • Tja, der war schon viel früher ausgefallen.


Was lernen wir daraus?

Man braucht auch einen Prozess, der sicherstellt, dass auch die Backup-Systeme stets einsatzbereit sind. Beim Auto heißt das, regelmäßig den Reservereifen checken. Im IT Umfeld braucht man jemand oder eher etwas, was das tut, also in der Regel ein Monitoring-System und eine Organisation, die da auch reinschaut und was tut, wenn ein Alarm kommt. Muss man nur dem erklären, der vorher schon das viele Geld für die Hochverfügbarkeit des Systems bezahlt hatte.

von Michael Dirk 30. Januar 2025
Cluster-Systeme erzeugen zusätzliche Komplexität
von Michael Dirk 13. September 2023
vom Untergang der Titanic bis zum MSA-Key-Hack bei Microsoft
von Michael Dirk 31. August 2023
Die FKTG, Fernseh- und Kinotechnische Gesellschaft verleiht Herrn Michael Dirk und WeltN24 GmbH ihren Innovationspreis für Informationstechnologie in den Medien 2022