RCA für ISP-Outages schreiben: Template + Beispiel-Corrective-Actions
Eine RCA für ISP-Outages zu schreiben, ist mehr als „ein Postmortem ausfüllen“. Im Provider-Umfeld geht es häufig um großflächige Auswirkungen, mehrere Fault Domains (Ring, PoP, SRLG, RR-Cluster, Peering-Fabric), komplexe Kausal-Ketten (Optikdegradation → Queue Drops → Routing-Instabilität → Service-Timeouts) und externe Abhängigkeiten (Carrier, IX, Vendor). Eine gute RCA (Root Cause Analysis) muss deshalb zwei Ziele gleichzeitig…









