Case Study: Effiziente Absicherung und Notfallplanung mit Hilfe von Cloud Computing

11 Februar, 2022

In Vorbereitung auf ein landesweites Groß-Event unterstützten wir unseren Kunden mit Hilfe der AWS Cloud bei der Absicherung eines On-Premise-betriebenen und für die Laufzeit des Events kritischen Online-Angebots, indem wir eine redundante Hot-Standby Umgebung in der AWS Cloud aufgebaut und getestet haben. Zusammen mit der Projektleitung und den relevanten Stakeholdern haben wir unter Einbindung aller Beteiligten eine maßgeschneiderte Notfallplanung nach BSI IT-Grundschutz entworfen und verprobt.

Für den Zeitraum der Veranstaltung haben wir ein Bereitschafts-Team aus erfahrenen Expert:innen gestellt, welches die Verfügbarkeit des Online-Angebots überwachte, den Status regelmäßig an die Projektleitung berichtete und bereit war, im Ernstfall innerhalb einer garantierten Reaktionszeit von weniger als zehn Minuten auf die Fallback-Cloud-Lösung umzuschalten.

Die Situation

Unser Kunde stand vor der Herausforderung, die Verfügbarkeit und Integrität eines On-Premise-betriebenen Online-Angebots sicherzustellen, welches für den Zeitraum eines landesweiten Großevents einem hohen öffentlichen Interesse ausgesetzt war. Das Online-Angebot wurde zur Laufzeit des Events kontinuierlich mit Datenströmen aus unterschiedlichen Quellen gespeist. Es war die Aufgabe des Systems, diese zu verarbeiten und mittels für die Öffentlichkeit über das Internet frei zugänglicher Dashboards im Browser zu visualisieren. Eine Verletzung der Verfügbarkeit und Integrität der zu Grunde liegenden Daten war mit einem sehr hohen Risiko von Reputationsschäden und negativer Berichterstattung für das Management verbunden. Aufgrund der hohen Sichtbarkeit und Exposition stellte das Online-Angebot für den Zeitraum der Veranstaltung ein attraktives Ziel für Cyber-Attacken dar, was die Notwendigkeit geeigneter Sicherheitsmaßnahmen und einer verlässlichen Notfallplanung für das Unternehmen zusätzlich erhöhte.

Unser Vorgehen

Um das primäre Online-Angebot abzusichern, haben wir ein redundantes Online-Angebot in der AWS Cloud aufgebaut und dessen ordnungsgemäße Funktionsfähigkeit getestet. Damit die Anwendung als Hot-Standby Fallback-Lösung innerhalb kürzester Zeit einsatzbereit ist, haben wir zudem die hierfür notwendigen technischen und organisatorischen Maßnahmen definiert und für den operativen Betriebsablauf umgesetzt.

Weiterhin haben wir den zugehörigen Notfallplan entworfen, abgestimmt und in Form eines Notfall-Handbuchs nach BSI IT-Grundschutz dokumentiert.

Aufbau des Online-Angebots

Der Cloud Service Provider AWS bietet ein breites Portfolio an verschiedenen Infrastruktur-, Plattform- und Software-Diensten (IaaS, PaaS und SaaS), die sich für die Umsetzung des Vorhabens eignen. In Kooperation mit der Projektleitung des Kunden und ausgewählten Expert:innen des Cloud Service Providers AWS erarbeitete unser ausgebildetes PwC-Team aus Risikomanagement-Spezialist:innen, AWS Solution-Architekt:innen und Cloud Security-Engineer das Design eines redundanten Online-Angebots in der AWS Cloud. Dieses konnten wir mit Hilfe des breiten AWS Service-Portfolios unter Verwendung zeitgemäßer und bewährter Cloud-Dienste (unter anderem AWS S3, Lambda@Edge und Amazon CloudFront) in kurzer Zeit realisieren und auf ordnungsgemäße Funktion testen.

Synchronisierung der Systeme

Um die Einsatzfähigkeit der Fallback-Lösung als Hot-Standby innerhalb kürzester Zeit sicherzustellen, wurden für den Betriebsablauf die notwendigen Maßnahmen für einen zum Primär-Angebot synchronen Stand von Systemstatus, Software und Daten definiert und umgesetzt.

Entwerfen des Notfallplans

Nach den Empfehlungen des BSI IT-Grundschutz haben wir in Abstimmung mit allen beteiligten Akteuren die Notfallplanung erstellt, um im Ernstfall, d.h. im Falle einer Störung mit Auswirkung auf die Verfügbarkeit und / oder die Integrität des primären Online-Angebots, kontrolliert die geplanten Gegenmaßnahmen ergreifen zu können. Im Notfallplan wurden, unter anderem, Krisenszenarien definiert, Rollen und Verantwortlichkeiten festgelegt, Deeskalations-Prozeduren und Maßnahmen beschrieben sowie Handlungsabläufe in Form von Arbeitsanweisungen und Klick-Streams im System festgehalten.

Da es sich um ein öffentlich verfügbares Online-Angebot handelte, wurde außerdem eine Kommunikationsstrategie an die Nutzer:innen der Plattform zur Laufzeit der Veranstaltung erarbeitet, um im Ernstfall beim Umschalten auf das Fallback-Angebot einen reibungslosen Informationsfluss und gut vorbereitete Öffentlichkeitsarbeit sicherzustellen.

Das Projektergebnis

Zur Laufzeit des Groß-Events war das Fallback-System einsatzbereit, die Notfallplanung bekannt und einstudiert und ein redundant besetztes PwC-Krisenteam war auf Hot-Standby Bereitschaft, um im Ernstfall mit einer Reaktionszeit von weniger als zehn Minuten handlungsfähig zu sein. Die Verfügbarkeit des primären Online-Angebots wurde durch ein eigens eingerichtetes, automatisiertes und cloudgestütztes Monitoring und Alerting fortlaufend überwacht und der Status wurde regelmäßig über den Leiter des PwC-Krisenteams an die Projektleitung kommuniziert.

Es kam während des Events zu keinen Zwischenfällen, die eine Aktivierung des Notfallplans erforderten. Nach Beendigung der Veranstaltung wurde das Krisenteam aufgelöst und die nicht mehr benötigte Cloud-Umgebung konnte, mitsamt der redundant vorgehaltenen Daten, durch wenige Handgriffe deprovisioniert werden.

„Robuste Prozesse und ausfallsichere Systeme sind essenziell, um für den Notfall gerüstet zu sein. Cloud Computing ist eine hervorragende Möglichkeit, sich kosteneffizient und zielgerichtet abzusichern.“

Jörg Botsch,Director Cloud IT Reliability, Risk & Compliance, PwC Deutschland
Follow us

Contact us

Jörg Botsch

Jörg Botsch

Partner, IT Reliability, Risk & Compliance, PwC Germany

Tel.: +49 160 5363994

Robert Eberhard

Robert Eberhard

Senior Manager, IT Reliability, Risk & Compliance, PwC Germany

Hide