RCA auf Expertenniveau: Ursachen, Faktoren, Maßnahmen sauber dokumentieren

RCA auf Expertenniveau (Root Cause Analysis) ist mehr als eine Pflichtübung nach einem Incident. Eine gute RCA ist ein technisches Dokument, das Ursache, beitragende Faktoren und wirksame Maßnahmen so sauber beschreibt, dass das Team daraus dauerhaft lernt, Wiederholungen verhindert und Entscheidungen gegenüber Stakeholdern begründen kann. Gerade in Netzwerken ist das entscheidend, weil Störungen selten monokausal…

SD-WAN Troubleshooting: Underlay Loss, SLA Monitoring und Pfadwahl

SD-WAN Troubleshooting ist in vielen Unternehmen der entscheidende Faktor, ob eine SD-WAN-Einführung als Erfolg wahrgenommen wird oder als „Black Box“, die im Incident schwer beherrschbar ist. Der Grund: SD-WAN verschiebt das klassische Denken von „ein WAN-Link, ein Router, eine Route“ hin zu einer dynamischen Pfadwahl über mehrere Underlays (MPLS, Internet, 4G/5G), gesteuert durch SLA Monitoring,…

SASE Troubleshooting: Cloud PoPs, Latenz und Policy Impacts

SASE Troubleshooting ist heute eine Kernkompetenz für Netzwerkteams, weil Security und WAN nicht mehr an einem zentralen Rechenzentrum enden, sondern in Cloud PoPs (Points of Presence) „unterwegs“ passieren. In einem SASE-Modell (Secure Access Service Edge) werden Nutzer, Standorte und Workloads über einen Anbieter-Backbone oder über Internet-Paths zu einem PoP geführt, dort werden Policies (z. B.…

ZTNA Troubleshooting: Identity, Posture und Access Policies debuggen

ZTNA Troubleshooting ist in vielen Unternehmen zur täglichen Betriebsaufgabe geworden, weil Zero Trust Network Access klassische VPN-Logik ersetzt: Nicht „im Netz sein“ zählt, sondern Identität, Gerätezustand (Posture) und kontextbasierte Access Policies entscheiden bei jedem Zugriff, ob eine Verbindung zustande kommt, wie lange sie gültig bleibt und welche Ressourcen erreichbar sind. Genau dadurch entstehen neue Fehlerbilder,…

NAC Troubleshooting: 802.1X, MAB, RADIUS und VLAN Assignment

NAC Troubleshooting (Network Access Control) ist in Enterprise-Netzen eine der anspruchsvollsten Betriebsaufgaben, weil hier mehrere Disziplinen gleichzeitig zusammenkommen: Layer-2/Layer-3-Konnektivität am Switchport, 802.1X/EAP zwischen Supplicant und Authenticator, RADIUS zwischen Switch und AAA-Server, Zertifikats- und Identitätslogik im Backend sowie dynamische VLAN Assignment und Zugriffspolicies. Genau deshalb wirken NAC-Störungen häufig „unlogisch“: Ein Laptop authentifiziert morgens, mittags landet er…

Wireless Troubleshooting: RF, Roaming, Airtime und Client Issues

Wireless Troubleshooting ist eine eigene Disziplin innerhalb der Netzwerktechnik, weil WLAN nicht nur „Ethernet ohne Kabel“ ist, sondern ein geteiltes Funkmedium mit physikalischen Grenzen, wechselnden Bedingungen und sehr unterschiedlichen Client-Verhaltensweisen. Genau deshalb wirken Störungen in der Praxis oft paradox: Das Signal ist „voll“, aber die Performance ist schlecht; Videokonferenzen ruckeln, obwohl Speedtests gut aussehen; Roaming…

VoIP Troubleshooting: SIP/RTP, One-Way Audio und Jitter Ursachen

VoIP Troubleshooting ist eine der wenigen Netzwerkdisziplinen, in der kleine Abweichungen sofort hörbar werden: Ein kurzer Paketverlust wird zu Knacken, Jitter wird zu „Roboterstimme“, Latenz macht Gespräche unangenehm, und ein scheinbar harmloser NAT- oder Firewall-Timeout führt zu One-Way Audio. Gleichzeitig besteht VoIP aus zwei Welten, die Sie im Incident strikt trennen müssen: SIP/SDP als Signalisierung…

Video Conferencing Issues: QoS, NAT, TURN und Path Debugging

Video Conferencing Issues gehören zu den häufigsten und zugleich frustrierendsten Störungen in Unternehmensnetzen: Bild friert ein, Ton wird robotisch, Teilnehmer „klingen blechern“, Screen Sharing ruckelt, oder Meetings funktionieren im Büro, aber nicht im Homeoffice. Das Problem ist selten „die Bandbreite“ allein, sondern meist eine Mischung aus QoS-Fehlkalibrierung, NAT- und Firewall-Nebenwirkungen sowie Pfadunterschieden zwischen UDP und…

Change-Induced Outages: Wie Sie Netzwerkchanges sicher debuggen

Change-Induced Outages sind die teuerste und gleichzeitig vermeidbarste Kategorie von Netzwerkstörungen. Gemeint sind Ausfälle, die direkt nach einem Change auftreten – egal ob es sich um ein vermeintlich kleines ACL-Update, ein Routing-Policy-Tuning, einen Firmware-Rollout, eine MTU-Anpassung oder eine Änderung an VLANs, Trunks, MLAG oder BGP handelt. In der Praxis ist der schwierigste Teil nicht das…

“It worked before”: Konfig-Drift und Diff-Analysen im Netzwerk

„It worked before“ ist einer der häufigsten und zugleich unerquicklichsten Sätze im Netzwerkbetrieb. Er bedeutet meist nicht, dass das Netzwerk „plötzlich“ kaputt gegangen ist, sondern dass sich der Normalzustand schleichend verändert hat: Konfig-Drift. Darunter versteht man Abweichungen zwischen dem erwarteten (dokumentierten oder versionierten) Konfigurationszustand und dem tatsächlich laufenden Zustand auf Geräten. Diese Abweichungen entstehen durch…