Latenzspitzen analysieren: Ursachen zwischen Queueing und Routing

Latenzspitzen analysieren ist eine der wichtigsten Fähigkeiten im Betrieb moderner IT-Netzwerke, weil kurze, wiederkehrende Verzögerungen oft mehr Schaden anrichten als ein klarer Ausfall. Nutzer erleben das als „alles ruckelt“, „VPN hängt kurz“, „API timeouts“ oder „VoIP klingt blechern“ – und im Monitoring sieht man vielleicht nur sporadische Peaks in RTT oder Jitter. Die Herausforderung: Latenzspitzen…

Jitter Troubleshooting: Echtzeitverkehr sauber diagnostizieren

Jitter Troubleshooting ist im Alltag von Netzwerkteams die entscheidende Disziplin, wenn Echtzeitverkehr wie VoIP, Video-Konferenzen, VDI-Audio oder Unified-Communications „gefühlt“ schlecht wird, obwohl klassische Verfügbarkeitschecks grün sind. Während Paketverlust und Totalausfälle meist eindeutig auffallen, zeigt sich Jitter subtil: Stimmen klingen abgehackt, Bilder frieren kurz ein, Gesprächspartner reden sich ins Wort, und Nutzer melden „es ruckelt“, ohne…

Throughput-Probleme: Warum “Bandbreite” nicht gleich Performance ist

Throughput-Probleme gehören zu den häufigsten und zugleich missverständlichsten Störungsmustern in IT-Netzwerken. Wenn Nutzer sagen „die Leitung ist langsam“, wird reflexartig nach mehr Bandbreite gerufen – obwohl die physische Linkrate in vielen Fällen gar nicht der limitierende Faktor ist. Genau hier liegt der Kern: Bandbreite ist eine Kapazitätsangabe (z. B. 1 Gbit/s), Performance beschreibt dagegen, wie…

Microbursts erkennen: Buffer, Queueing und Drops im LAN/WAN

Microbursts erkennen ist eine der wichtigsten Fähigkeiten für Netzwerkteams, weil genau diese ultrakurzen Traffic-Spitzen häufig die Ursache für „sporadische“ Probleme sind: kurze Latenzspitzen, Jitter in Voice/Video, TCP Retransmits, Paketverlust und scheinbar zufällige Timeouts – obwohl die durchschnittliche Link-Auslastung völlig unauffällig aussieht. In LAN- und WAN-Umgebungen entstehen Microbursts typischerweise durch Traffic-Aggregation (viele schnelle Server auf einen…

TCP Retransmissions: Netzwerkproblem oder Server/Stack?

TCP Retransmissions (TCP-Neuübertragungen) sind eines der häufigsten „Warnsignale“ im Netzwerkmonitoring – und zugleich eines der am häufigsten missinterpretierten. In vielen Tickets steht dann nur: „Retransmits steigen, Netzwerkproblem?“ Doch TCP Retransmissions sind kein eindeutiger Beweis für einen defekten Link oder einen schlechten Provider. Sie sind ein Symptom dafür, dass ein Sender ein Segment erneut sendet, weil…

MTU/MSS Debugging: PMTUD Blackholes und Fragmentierung finden

MTU/MSS Debugging gehört zu den klassischen „mysteriösen“ Fehlerbildern im Netzwerkbetrieb: Logins funktionieren, kleine Webseiten laden, aber große Uploads hängen; ein VPN verbindet, doch bestimmte Anwendungen laufen nur sporadisch; TLS-Handshakes bleiben stehen, obwohl Ping und Traceroute „gut“ aussehen. In vielen Fällen steckt kein DNS- oder Routingproblem dahinter, sondern eine falsche Path MTU (PMTU), ein fehlerhafter MSS-Wert…

Duplex/Autoneg Issues: Klassiker auf Layer 1/2 sauber beweisen

Duplex/Autoneg Issues sind ein Klassiker auf Layer 1/2 – und genau deshalb so gefährlich: Sie treten selten als kompletter Ausfall auf, sondern als „komische“ Performanceprobleme. Anwendungen wirken langsam, VoIP knackt, Datenübertragungen brechen sporadisch ein, TCP Retransmissions steigen, aber die Link-Auslastung sieht harmlos aus. Oft liegt die Ursache in einer Duplex-Mismatch-Situation (eine Seite Full Duplex, die…

CRC/Interface Errors: Hardware, Kabel, Optics oder Congestion?

CRC/Interface Errors sind im Netzwerkbetrieb ein zweischneidiges Schwert: Einerseits liefern sie einen der klarsten Hinweise auf Probleme auf Layer 1/2, andererseits werden sie in der Praxis häufig falsch gedeutet. In Tickets liest man dann Sätze wie „CRC Errors auf dem Uplink – ist die Leitung voll?“ oder „Interface Errors steigen, wahrscheinlich Congestion“. Genau hier beginnt…

Layer-1 bis Layer-7: Systematisches Troubleshooting in komplexen Netzen

Layer-1 bis Layer-7 Troubleshooting ist in komplexen Netzen der zuverlässigste Weg, Störungen reproduzierbar zu finden und zu beheben – ohne Aktionismus und ohne „Try & Error“. Gerade in hybriden Unternehmensumgebungen mit Campus, Rechenzentrum, Cloud, SD-WAN, VPN, Firewalls, Load Balancern und mehreren Providern entstehen Symptome oft weit entfernt von ihrer Ursache: Ein fehlerhaftes Glasfaser-Patchkabel (Layer 1)…

Optical Troubleshooting: SFP DOM Werte, Dämpfung und Budget-Rechnung

Optical Troubleshooting ist eine Kernkompetenz im Betrieb moderner IT-Netzwerke, weil ein einzelnes Glasfaserproblem oft wie ein „mysteriöser“ Layer-4/7-Fehler wirkt: TCP Retransmissions steigen, VoIP jittert, Services werden sporadisch langsam – und trotzdem steht der Link auf „up“. Genau hier helfen SFP DOM Werte (Digital Optical Monitoring), eine saubere Dämpfungsanalyse und die Budget-Rechnung (Link Budget), um Fehler…