SD-WAN Troubleshooting: Underlay Loss, SLA Monitoring und Pfadwahl

SD-WAN Troubleshooting ist in vielen Unternehmen der entscheidende Faktor, ob eine SD-WAN-Einführung als Erfolg wahrgenommen wird oder als „Black Box“, die im Incident schwer beherrschbar ist. Der Grund: SD-WAN verschiebt das klassische Denken von „ein WAN-Link, ein Router, eine Route“ hin zu einer dynamischen Pfadwahl über mehrere Underlays (MPLS, Internet, 4G/5G), gesteuert durch SLA Monitoring,…

SASE Troubleshooting: Cloud PoPs, Latenz und Policy Impacts

SASE Troubleshooting ist heute eine Kernkompetenz für Netzwerkteams, weil Security und WAN nicht mehr an einem zentralen Rechenzentrum enden, sondern in Cloud PoPs (Points of Presence) „unterwegs“ passieren. In einem SASE-Modell (Secure Access Service Edge) werden Nutzer, Standorte und Workloads über einen Anbieter-Backbone oder über Internet-Paths zu einem PoP geführt, dort werden Policies (z. B.…

ZTNA Troubleshooting: Identity, Posture und Access Policies debuggen

ZTNA Troubleshooting ist in vielen Unternehmen zur täglichen Betriebsaufgabe geworden, weil Zero Trust Network Access klassische VPN-Logik ersetzt: Nicht „im Netz sein“ zählt, sondern Identität, Gerätezustand (Posture) und kontextbasierte Access Policies entscheiden bei jedem Zugriff, ob eine Verbindung zustande kommt, wie lange sie gültig bleibt und welche Ressourcen erreichbar sind. Genau dadurch entstehen neue Fehlerbilder,…

NAC Troubleshooting: 802.1X, MAB, RADIUS und VLAN Assignment

NAC Troubleshooting (Network Access Control) ist in Enterprise-Netzen eine der anspruchsvollsten Betriebsaufgaben, weil hier mehrere Disziplinen gleichzeitig zusammenkommen: Layer-2/Layer-3-Konnektivität am Switchport, 802.1X/EAP zwischen Supplicant und Authenticator, RADIUS zwischen Switch und AAA-Server, Zertifikats- und Identitätslogik im Backend sowie dynamische VLAN Assignment und Zugriffspolicies. Genau deshalb wirken NAC-Störungen häufig „unlogisch“: Ein Laptop authentifiziert morgens, mittags landet er…

Flapping Links: Root Cause zwischen Optics, LACP und Bugs

Flapping Links sind eine der teuersten Störungsklassen im Netzwerkbetrieb, weil sie selten „hart“ ausfallen, sondern in kurzen Intervallen hoch und runter gehen – mit maximaler Wirkung auf Routing, LACP-Bundles, STP, ECMP und damit auf Applikationslatenz und Verfügbarkeit. Genau deshalb ist die Root Cause Analysis bei Link Flaps oft schwieriger als bei einem klaren Down: Wenn…

High CPU auf Netzwerkgeräten: Control Plane Overload nachweisen

High CPU auf Netzwerkgeräten ist eines der tückischsten Fehlerbilder im Betrieb, weil es sich selten wie ein „klassischer“ Link-Ausfall anfühlt. Stattdessen sehen Sie Symptome, die überall und nirgendwo auftreten: BGP-Sessions flappen, OSPF-Adjazenzen werden instabil, SNMP/Telemetry hat Lücken, CLI reagiert zäh, einzelne Flows timeouten, ARP/ND-Auflösung wird langsam, und manchmal wirkt das Gerät plötzlich „wie eingefroren“. In…

Memory/TCAM Exhaustion: Symptome, Nachweise und Mitigation

Memory/TCAM Exhaustion ist eine der unangenehmsten Fehlerklassen in der Netzwerktechnik, weil sie selten als „harte“ Störung startet. Stattdessen beginnt es schleichend: Ein neues ACL-Template wird ausgerollt, ein zusätzlicher VRF kommt dazu, BGP nimmt mehr Prefixe an, ein Security-Team aktiviert neue Signaturen, oder ein Campus-Switch bekommt plötzlich sehr viele MAC-Adressen. Zunächst scheint alles stabil, doch unter…

Control Plane Policing Debugging: CoPP greift zu hart (oder gar nicht)

Control Plane Policing Debugging ist eine der wichtigsten, aber zugleich frustrierendsten Aufgaben im Betrieb moderner Router und Switches: CoPP (Control Plane Policing) soll die Control Plane schützen, damit Routing-Protokolle, ARP/ND, Management und Exception-Handling auch unter Stress zuverlässig funktionieren. In der Praxis passiert jedoch häufig das Gegenteil: CoPP greift zu hart, schneidet legitimen Traffic ab und…

uRPF Debugging: Anti-Spoofing ohne legitimen Traffic zu droppen

uRPF Debugging ist in modernen Netzwerken ein Balanceakt: Einerseits ist uRPF (Unicast Reverse Path Forwarding) ein äußerst wirksames Anti-Spoofing-Werkzeug, um Quelladressfälschung und Reflection-Angriffe zu reduzieren. Andererseits kann uRPF legitimen Traffic droppen, wenn Routing asymmetrisch ist, wenn ECMP im Spiel ist oder wenn Kunden- und Overlay-Designs nicht strikt „symmetrisch“ funktionieren. Das ist der Punkt, an dem…

IPv6 Troubleshooting: RA/ND, SLAAC, DHCPv6 und Prefix Filter

IPv6 Troubleshooting ist in vielen Umgebungen der Moment der Wahrheit: Auf dem Papier ist IPv6 „einfach nur eine größere Adresse“, in der Praxis hängen jedoch Adressvergabe, Default Gateway, Neighbor Discovery, Sicherheitsfilter und Routing viel enger zusammen als in klassischen IPv4-Designs. Typische Symptome klingen zunächst banal – Clients bekommen keine IPv6-Adresse, DNS funktioniert nur teilweise, einzelne…