Ein Konzept für die Disaster Recovery zur Wiederherstellung des IT-Betriebs stellt die Lebensversicherung für ein KMU dar. Es ermöglicht bei einem IT-Notfall, Computer- bzw. Netzwerk-Anwendungen inklusive der benötigten Daten rasch wieder zu aktivieren oder die IT Security wiederherzustellen. Notwendig werden kann ein Disaster Recovery etwa nach folgenden Vorkommnissen:
- Angriffe auf die Cyber Security
- Hardwareausfälle
- Systemabstürze
- Brände, Überschwemmungen, Naturkatastrophen
- Fehlbedienung der IT-Systeme durch Mitarbeitende
- Störungen beim IT-Dienstleister oder Ausfälle der IT-Infrastruktur
Ziel eines Disaster Recovery ist es, die negativen Auswirkungen eines IT-Ausfalls für ein KMU zu minimieren. Während der Wiederherstellung werden Daten aus einer Sicherung eingespielt, Server und IT-Prozesse wieder in Betrieb genommen oder Netzwerkfunktionen bereitgestellt. Damit ein Disaster Recovery im Ernstfall möglichst reibungslos gelingt, sind die folgenden fünf häufigsten Fehler zu vermeiden.
Disaster Recovery: Diese fünf Fehler gilt es beim Wiederherstellen des IT-Betriebs zu vermeiden
Fehler 1: Es ist kein Wiederherstellungsplan vorhanden
Von entscheidender Bedeutung für das Gelingen von Disaster Recovery ist das Vorhandensein eines Wiederherstellungsplans. Er beinhaltet alle durchzuführenden Tätigkeiten und Massnahmen, die nach einem IT-Ausfall oder einem Cyber-Security-Vorfall zu ergreifen sind. Der Wiederherstellungsplan benennt darüber hinaus Verantwortlichkeiten, definiert Eskalationswege und berücksichtigt die verschiedenen Ausfallszenarien. Er ist so gestaltet, dass die Verantwortlichen im Ernstfall die verschiedenen Tätigkeiten Schritt für Schritt erledigen können.
Tätigkeiten, die bei einer IT-Störung durchgeführt werden müssen, sind beispielsweise die Bereitstellung und Inbetriebnahme von Ersatzsystemen, das Aktivieren von redundanten Verbindungen oder das Einspielen von Datensicherungen. Im Optimalfall reduziert die schrittweise Abarbeitung des Wiederherstellungsplans die negativen Auswirkungen für das Unternehmen auf ein Minimum und erlaubt eine schnelle Wiederaufnahme des Betriebs.
Fehler 2: Das Disaster-Recovery-Team ist nicht vorhanden oder nicht verfügbar
Ein häufig beobachteter Fehler ist, dass zwar Verantwortlichkeiten im Wiederherstellungsplan benannt sind, aber ein Disaster-Recovery-Team im Notfall nicht vorhanden oder nicht verfügbar ist. Das Disaster-Recovery-Team kümmert sich im Ernstfall um die einzelnen Massnahmen und führt alle notwendigen Tätigkeiten durch.
Das Team soll aus Personen bestehen, die das Know-how und die technischen Fertigkeiten besitzen, den Wiederherstellungsplan vollständig abzuarbeiten – im Idealfall stammen sie aus allen wichtigen Unternehmensbereichen. Es sind Personen zu benennen und Ressourcen zu schaffen, damit das Team im Ernstfall greifbar und einsatzbereit ist. Dazu gehört es, Urlaube, Vertretungen oder Bereitschaften so zu planen, dass die benötigten Ressourcen zu jeder Zeit verfügbar sind.
Fehler 3: Die Datensicherung erweist sich als ungenügend
Eine wichtige Rolle bei der Wiederaufnahme des IT-Betriebs, beispielsweise nach einem Vorfall in der Cyber Security, spielt die Datensicherung. Sie gestattet es, manipulierte, gelöschte oder gestohlene Daten wieder einzuspielen. Fatal ist es, wenn sich im Ernstfall herausstellt, dass die vorhandene Datensicherung ungenügend ist. So kann es passieren, dass vergessen wurde, wichtige Daten in die Datensicherungsprozedur aufzunehmen. Sind die Daten in der Sicherung nicht vorhanden, sind sie für immer verloren. Ein ebenfalls häufiger Fehler der Datensicherung ist es, die Daten nicht häufig genug zu sichern. Daten, die sich oft verändern, haben in diesem Fall einen Stand, der veraltet und eventuell nicht mehr brauchbar ist.
Vermeiden lassen sich die Fehler beim Backup, wenn die Inhalte der Sicherungen regelmässig gesichtet und auf Vollständigkeit geprüft werden. Im Vorfeld des Backups sollten sich die Verantwortlichen Gedanken machen, wie viel Datenverlust zu verkraften ist. In diesem Zusammenhang spielt die RPO-Definition (Recovery Point Objective) eine wichtige Rolle. Recovery Point Objective ist die Zeit, die zwischen zwei Sicherungsdurchläufen liegen darf. Sie bestimmt, für welche maximale Zeitspanne Daten seit der letzten Sicherung bei einer Störung oder einem IT Security Vorfall verloren gehen «dürfen». Je kleiner der akzeptable Datenverlust ist, desto niedriger ist die RPO zu wählen und umso häufiger muss ein Backup durchgeführt werden.
Fehler 4: Der Wiederherstellungsplan wird bei betrieblichen Veränderungen nicht aktualisiert
Im digitalen Zeitalter verändern sich Unternehmen und betriebliche Prozesse rasant. Diese Veränderungen sind im Wiederherstellungsplan zu berücksichtigen. Es reicht auf keinen Fall aus, den Plan einmalig zu erstellen und ihn anschliessend bis zu seinem Einsatz in der Schublade verschwinden zu lassen. Im Unternehmen ist ein Prozess aufzusetzen, der den Wiederherstellungsplan in regelmässigen Abständen prüft und gegebenenfalls überarbeitet. Beispielsweise kann es notwendig sein, neue Personen für das Disaster-Recovery-Team zu benennen, Anweisungen und Tätigkeiten für neue IT-Systeme aufzunehmen oder aktuelle Bedrohungslagen der IT Security zu berücksichtigen.
Fehler 5: Die Wiederherstellung wird nicht regelmässig geübt
Auch bei einem Disaster Recovery gilt: Übung macht den Meister. Die Wiederherstellung des IT-Betriebs gelingt nur dann möglichst reibungslos, wenn die zu ergreifenden Massnahmen und auszuführenden Tätigkeiten regelmässig geübt werden. Bei diesen Übungen machen sich die Mitglieder des Disaster-Recovery-Teams mit den Tätigkeiten der Wiederherstellung vertraut. Im Ernstfall stehen sie dann nicht vor unlösbaren Problemen. Während den regelmässigen Katastrophenübungen fallen Fehler, unwirksame Massnahmen oder falsche Verantwortlichkeiten im Wiederherstellungsplan auf. Nach einer durchgeführten Übung sind die gewonnenen Erkenntnisse zu sammeln und in aktuelle Vorgaben und Massnahmen des Wiederherstellungsplans zu überführen. Nicht zu vergessen ist der erhöhte Stressfaktor in einem Katastrophenfall. Haben die Mitarbeitenden die Recovery-Tätigkeiten zuvor nicht geübt und schon einmal ausgeführt, führt der ohnehin schon gestiegene Stresspegel unweigerlich zu vermeidbaren Fehlern, die gravierende Auswirkungen auf das Unternehmen haben können.
Fazit
Fehler beim Disaster Recovery gefährden im Ernstfall das Gelingen der Wiederherstellung der IT-Systeme und des IT-Betriebs. Die Folgen reichen von finanziellen Verlusten bis zur existenziellen Gefährdung eines Unternehmens. Zentrale Voraussetzungen für das Gelingen eines Disaster Recovery ist das Vorhandensein eines wirksamen Wiederherstellungsplans und einer Datensicherung mit allen wichtigen Daten auf aktuellem Stand. Regelmässige Katastrophenübungen des Recovery-Teams helfen, die Wirksamkeit des Plans zu prüfen und beugen Problemen während der Wiederherstellung vor. Anbieter von Managed IT Services bieten Unterstützung bei der Ausarbeitung eines Wiederherstellungsplans oder bei der eigentlichen Umsetzung des Disaster Recovery.
Titelbild: Shutterstock