QinQ Debugging: C-Tag/S-Tag Fehlerbilder und MTU-Fallen

QinQ Debugging ist eine Spezialdisziplin im VLAN/Trunk Troubleshooting – und genau deshalb in der Praxis oft ein Zeitfresser. Sobald ein Provider- oder Campus-Backbone doppelt getaggte Frames transportiert (C-Tag/S-Tag), entstehen Fehlerbilder, die auf den ersten Blick wie Routing-, Firewall- oder Applikationsprobleme wirken: einzelne Kunden-VLANs sind „tot“, ARP/MAC-Tabellen flappen, DHCP funktioniert nur sporadisch, oder große Transfers hängen…

Asymmetrisches Routing: Nachweise, Auswirkungen, Korrekturen

Asymmetrisches Routing beschreibt eine Situation, in der Hin- und Rückweg eines Datenflusses unterschiedliche Pfade durch das Netzwerk nehmen. Das ist in modernen Netzen mit ECMP, Multi-Homing, SD-WAN, mehreren Internet-Exits, VRFs, Anycast-Services und Policy-Based Routing keineswegs selten – und auch nicht automatisch „falsch“. Problematisch wird asymmetrisches Routing jedoch dann, wenn entlang des Pfades zustandsbehaftete Komponenten (Stateful…

STP Troubleshooting: Root Placement, TCN Storms und Loop-Forensik

STP Troubleshooting gehört zu den „High-Impact“-Disziplinen im LAN und im klassischen Campus-Netz, weil Spanning Tree Protocol (STP) im Fehlerfall nicht nur einzelne Hosts betrifft, sondern ganze VLANs oder Broadcast-Domains destabilisieren kann. Wenn Root Placement falsch ist, laufen Pfade unnötig lang, Uplinks werden überlastet und Latenzspitzen steigen. Wenn TCN Storms (Topology Change Notifications) auftreten, kippt die…

MPLS Troubleshooting: LDP, Label Switched Paths und PHP Issues

MPLS Troubleshooting ist in Provider-, Campus-Backbone- und WAN-Umgebungen eine der schnellsten Möglichkeiten, große Störungen sauber einzugrenzen, weil MPLS (Multiprotocol Label Switching) oft das „Transportgewebe“ für L3VPN, L2VPN, Traffic Engineering oder Segmentierung bildet. Wenn MPLS hakt, wirkt das nach außen häufig wie ein Routing-, Firewall- oder Applikationsproblem: einzelne Sites sind nicht erreichbar, nur bestimmte VPNs brechen…

Postmortems im Netzwerk: Von RCA zu nachhaltigen Fixes

Postmortems im Netzwerk sind der Moment, in dem aus einem Incident echte Betriebsexzellenz entsteht. Während der Störung zählt zuerst die Wiederherstellung – danach entscheidet die Nachbereitung, ob das Problem dauerhaft verschwindet oder in neuer Form zurückkehrt. Genau hier liegt der Unterschied zwischen „wir haben es behoben“ und „wir haben es verstanden“. Eine Root Cause Analysis…

Paketverlust debuggen: Wo Drops wirklich entstehen (End-to-End)

Paketverlust debuggen gehört zu den anspruchsvollsten Aufgaben im Netzwerkbetrieb, weil „Drops“ an vielen Stellen entstehen können – und weil das Symptom oft weit entfernt von der Ursache sichtbar wird. Anwender merken es als ruckelnde Meetings, stockende VPNs, langsame APIs oder sporadische Timeouts. Technisch sehen Sie vielleicht TCP Retransmits, steigende Latenz, Jitter-Spitzen oder „Application Errors“. Doch…

Latenzspitzen analysieren: Ursachen zwischen Queueing und Routing

Latenzspitzen analysieren ist eine der wichtigsten Fähigkeiten im Betrieb moderner IT-Netzwerke, weil kurze, wiederkehrende Verzögerungen oft mehr Schaden anrichten als ein klarer Ausfall. Nutzer erleben das als „alles ruckelt“, „VPN hängt kurz“, „API timeouts“ oder „VoIP klingt blechern“ – und im Monitoring sieht man vielleicht nur sporadische Peaks in RTT oder Jitter. Die Herausforderung: Latenzspitzen…

Jitter Troubleshooting: Echtzeitverkehr sauber diagnostizieren

Jitter Troubleshooting ist im Alltag von Netzwerkteams die entscheidende Disziplin, wenn Echtzeitverkehr wie VoIP, Video-Konferenzen, VDI-Audio oder Unified-Communications „gefühlt“ schlecht wird, obwohl klassische Verfügbarkeitschecks grün sind. Während Paketverlust und Totalausfälle meist eindeutig auffallen, zeigt sich Jitter subtil: Stimmen klingen abgehackt, Bilder frieren kurz ein, Gesprächspartner reden sich ins Wort, und Nutzer melden „es ruckelt“, ohne…

Throughput-Probleme: Warum “Bandbreite” nicht gleich Performance ist

Throughput-Probleme gehören zu den häufigsten und zugleich missverständlichsten Störungsmustern in IT-Netzwerken. Wenn Nutzer sagen „die Leitung ist langsam“, wird reflexartig nach mehr Bandbreite gerufen – obwohl die physische Linkrate in vielen Fällen gar nicht der limitierende Faktor ist. Genau hier liegt der Kern: Bandbreite ist eine Kapazitätsangabe (z. B. 1 Gbit/s), Performance beschreibt dagegen, wie…

Microbursts erkennen: Buffer, Queueing und Drops im LAN/WAN

Microbursts erkennen ist eine der wichtigsten Fähigkeiten für Netzwerkteams, weil genau diese ultrakurzen Traffic-Spitzen häufig die Ursache für „sporadische“ Probleme sind: kurze Latenzspitzen, Jitter in Voice/Video, TCP Retransmits, Paketverlust und scheinbar zufällige Timeouts – obwohl die durchschnittliche Link-Auslastung völlig unauffällig aussieht. In LAN- und WAN-Umgebungen entstehen Microbursts typischerweise durch Traffic-Aggregation (viele schnelle Server auf einen…