Standard Command Set: „20 Commands“ für 80% der Incidents

Das Thema Standard Command Set: „20 Commands“ für 80% der Incidents ist für NOC-, Operations- und On-Call-Teams ein echter Hebel für Stabilität, Geschwindigkeit und Qualität. In der Praxis eskalieren viele Störungen nicht deshalb, weil sie technisch unlösbar wären, sondern weil in den ersten Minuten wichtige Basisdaten fehlen, Kommandos ad hoc gewählt werden oder jeder Engineer…

VLAN-Drift-Audit: Incidents „plötzlich weg“ verhindern

Ein systematischer VLAN-Drift-Audit: Incidents „plötzlich weg“ verhindern ist in modernen Netzwerken kein optionales Qualitätsprojekt, sondern eine betriebliche Pflichtaufgabe. In vielen Umgebungen treten Störungen nicht als klarer Totalausfall auf, sondern als schwer greifbare, intermittierende Symptome: einzelne Clients verlieren sporadisch Konnektivität, Applikationen wirken zeitweise langsam, Monitoring zeigt nur kurzzeitige Alarme, und beim erneuten Prüfen scheint „alles wieder…

ARP-Storm: Messen, begrenzen und recovern

Ein belastbares Vorgehen für ARP-Storm: Messen, begrenzen und recovern ist in produktiven Netzwerken unverzichtbar, weil ARP-basierte Störlagen selten als klarer Einzeldefekt auftreten. In der Praxis zeigen sie sich häufig als diffus verteilte Symptome: sporadische Paketverluste, plötzlich steigende Latenz, zeitweise nicht erreichbare Gateways, ungewöhnliche CPU-Spitzen auf Access- oder Distribution-Switches und Anwendungen, die nur für einen Teil…

OSPF Neighbor Down: Root-Cause-Matrix fürs NOC

Ein belastbares Vorgehen für OSPF Neighbor Down: Root-Cause-Matrix fürs NOC ist in modernen Betriebsumgebungen unverzichtbar, weil ein verlorener OSPF-Nachbar nicht nur ein Routing-Detail ist, sondern häufig der Startpunkt für weitreichende Service-Störungen. In der Praxis tritt das Problem selten als sauber isolierter Fehler auf. Stattdessen sehen NOC-Teams Symptome wie erhöhte Latenz, unerwartete Pfadwechsel, intermittierende Paketverluste, kurzzeitige…

BGP-Flap: Transport, Timer oder Policy?

Ein belastbares Vorgehen für BGP-Flap: Transport, Timer oder Policy? ist in produktiven Netzwerken entscheidend, weil instabile BGP-Sessions nicht nur Routing-Tabellen beeinflussen, sondern unmittelbar auf Verfügbarkeit, Latenz, Paketverlust und Kundenerfahrung durchschlagen. In der Praxis wirkt ein BGP-Flap zunächst simpel: Session up, Session down, Session up. Die Ursachen sind jedoch vielschichtig. Häufig steckt kein einzelner Defekt dahinter,…

Interner Route Leak: Signale und Response-Plan

Ein sauberer Umgang mit Interner Route Leak: Signale und Response-Plan ist für den stabilen Netzbetrieb genauso wichtig wie Redundanz, Monitoring und Change-Disziplin. Der kritische Punkt: Ein interner Route Leak kündigt sich selten mit einem einzigen klaren Alarm an. Meistens treten mehrere scheinbar unabhängige Symptome gleichzeitig auf, etwa plötzliche Pfadänderungen, unerwarteter Ost-West-Traffic, CPU-Spitzen auf Route-Reflektoren, starkes…

VRF-Misroute: Case Study „Tenant auf dem falschen Pfad“

Die Analyse VRF-Misroute: Case Study „Tenant auf dem falschen Pfad“ ist in modernen Multi-Tenant-Netzen ein zentraler Baustein für stabile Servicequalität. In der Praxis entsteht eine Misroute selten als spektakulärer Totalausfall, sondern als schleichendes Routing-Fehlverhalten: Ein Tenant erreicht Ziele mit erhöhter Latenz, einzelne Anwendungen sind sporadisch nicht erreichbar, Rückwege wirken asymmetrisch, Security-Policies greifen „unerwartet“ oder Traffic…

ECMP-Issue: Warum nur ein Teil des Traffics kaputt ist

Ein typisches ECMP-Issue: Warum nur ein Teil des Traffics kaputt ist gehört zu den irritierendsten Fehlerbildern im Netzwerkbetrieb. Aus Sicht von Anwendern wirkt die Störung „zufällig“: Manche Verbindungen funktionieren stabil, andere brechen reproduzierbar ab, Downloads laufen mal schnell und mal gar nicht, API-Calls liefern eine gemischte Quote aus Erfolgen und Timeouts. Genau dieses Muster führt…

Migration 1G→10G→100G: Häufigste Pitfalls

Die Migration 1G→10G→100G: Häufigste Pitfalls ist für viele Unternehmen kein einmaliges Projekt, sondern ein mehrjähriger Transformationspfad mit technischen, organisatorischen und finanziellen Abhängigkeiten. In der Praxis scheitern Upgrades selten an der reinen Portgeschwindigkeit, sondern an Nebeneffekten: falsche Optik- und Kabelannahmen, unvollständige Kompatibilitätsmatrizen, unzureichende Strom- und Kühlreserven, inkonsistente Monitoring-Baselines oder zu optimistische Rollout-Pläne ohne belastbare Fallback-Logik. Besonders…

DOM/DDM lesen: dBm, Tx/Rx-Power und Thresholds

Wer im Netzwerkbetrieb optische Links zuverlässig bewerten will, kommt an dem Thema DOM/DDM lesen: dBm, Tx/Rx-Power und Thresholds nicht vorbei. Genau hier entscheidet sich oft, ob eine Störung früh erkannt oder erst im Ausfall sichtbar wird. Digital Optical Monitoring (DOM) beziehungsweise Digital Diagnostic Monitoring (DDM) liefert Echtzeitdaten direkt aus dem Transceiver: Sendeleistung, Empfangsleistung, Temperatur, Versorgungsspannung…