Packet Loss vs. Congestion: Anhand von Telemetrie unterscheiden

Die saubere Abgrenzung von „Packet Loss vs. Congestion: Anhand von Telemetrie unterscheiden“ gehört zu den wichtigsten Fähigkeiten im modernen Netzwerkbetrieb. In der Praxis werden beide Phänomene häufig gleichgesetzt, obwohl sie unterschiedliche Ursachen, unterschiedliche Gegenmaßnahmen und unterschiedliche Risiken für Applikationen mit sich bringen. Wer Paketverlust und Überlast nicht präzise trennt, reagiert oft mit falschen Maßnahmen: Bandbreite…

L1–L3-Checkliste bei Link Flaps

Eine belastbare L1–L3-Checkliste bei Link Flaps ist für stabile Netzwerke unverzichtbar, weil kurze Up/Down-Ereignisse auf Interfaces in der Praxis überproportional viel Schaden verursachen: Routing-Nachbarschaften resetten, Voice- und Videoströme brechen ab, TCP-Sessions geraten in Retransmit-Schleifen, Cluster verlieren Heartbeats, und Monitoring erzeugt Alarm-Stürme. Genau deshalb sollte die Analyse von Link Flaps nicht mit Einzelkommandos beginnen, sondern mit…

MTU-/Fragmentierungsprobleme troubleshooten ohne Trial-and-Error

Das Thema „MTU-/Fragmentierungsprobleme troubleshooten ohne Trial-and-Error“ ist im Netzwerkbetrieb besonders relevant, weil solche Fehlerbilder oft unauffällig starten, aber in der Praxis zu schwer erklärbaren Ausfällen führen: Webseiten laden teilweise, VPN-Verbindungen sind „verbunden aber unbenutzbar“, API-Calls laufen in Timeouts, große Transfers scheitern, kleine Requests funktionieren. Genau diese Inkonsistenz verleitet viele Teams zu hektischem Herumprobieren an MSS,…

„Nur ein Teil der User hat Errors“: ECMP/Hashing-Issues aufdecken

Das Fehlerbild „Nur ein Teil der User hat Errors“: ECMP/Hashing-Issues aufdecken ist im Netzwerkbetrieb besonders tückisch, weil es auf den ersten Blick wie ein zufälliger Applikationsfehler wirkt. Einige Nutzer arbeiten ohne Probleme, andere erhalten Timeouts, Resets oder sporadische 5xx-Fehler – oft zur gleichen Zeit, auf denselben Services und mit identischen Clients. Genau diese selektive Betroffenheit…

Asymmetrisches Routing: Typische Symptome und Bestätigung

Das Thema „Asymmetrisches Routing: Typische Symptome und Bestätigung“ ist in modernen Netzwerken hochrelevant, weil es in hybriden Architekturen, Multi-Cloud-Topologien, SD-WAN-Umgebungen und Security-Zonen schnell zu schwer greifbaren Störungen führt. Besonders tückisch ist, dass asymmetrisches Routing nicht zwangsläufig ein Fehler sein muss: In vielen Designs ist es normal, dass Hin- und Rückweg unterschiedlich verlaufen. Problematisch wird es…

Wenn Traceroute täuscht: Wann du andere Tools brauchst

Das Thema „Wenn Traceroute täuscht: Wann du andere Tools brauchst“ ist für den operativen Netzwerkalltag entscheidend, weil Traceroute zwar schnell verfügbar ist, aber in modernen Infrastrukturen nur einen Ausschnitt der Realität zeigt. Viele Teams verlassen sich im Incident zu früh auf einzelne Hop-Zeilen und interpretieren daraus Ursachen, die sich später als falsch herausstellen. Das kostet…

DHCP-Failures diagnostizieren: Von L2 bis L7

Das Thema „DHCP-Failures diagnostizieren: Von L2 bis L7“ ist im operativen IT-Alltag zentral, weil ein einzelner Fehler in der Adressvergabe oft ganze Nutzergruppen vom Netzwerkzugang ausschließt. Wenn Endgeräte keine gültige IP-Konfiguration erhalten, wirken die Symptome zunächst unspezifisch: keine Internetverbindung, keine Namensauflösung, keine Anmeldung an internen Diensten, keine Erreichbarkeit von Applikationen. In vielen Umgebungen wird dann…

VLAN-Probleme: Mismatch vs. Allowed-VLAN-Drift schnell prüfen

Das Thema „VLAN-Probleme: Mismatch vs. Allowed-VLAN-Drift schnell prüfen“ ist im Netzwerkbetrieb ein echter Zeitfresser, weil die Symptome oft ähnlich aussehen, die Ursachen aber unterschiedlich sind. Anwender melden „Netz weg“, VoIP-Clients registrieren sich nicht, Access Points verlieren einzelne SSIDs, Server sind nur aus manchen Segmenten erreichbar – und in vielen Fällen liegt die Wurzel nicht in…

DNS-Tunneling-Detection: Use Case für Telco Security

DNS-Tunneling-Detection ist für Telco-Security ein praxisnaher Use Case, weil DNS in nahezu jeder Provider-Infrastruktur als „Grundrauschen“ vorhanden ist: Endkunden benötigen Namensauflösung, interne Systeme nutzen DNS für Service Discovery, und viele Sicherheits- und Performance-Funktionen hängen daran. Genau diese Allgegenwart macht DNS zu einem attraktiven Transportkanal für Angreifer. Beim DNS-Tunneling werden Daten in DNS-Queries und -Responses versteckt,…

Capacity & Congestion: Bottleneck in L1, L3 oder L7 bestimmen

Capacity & Congestion gehören zu den häufigsten Ursachen für Performance-Probleme in Provider- und Enterprise-Netzen – und gleichzeitig zu den am häufigsten falsch diagnostizierten. Der Grund ist simpel: Ein Bottleneck zeigt sich selten dort, wo er entsteht. Ein überbuchter Uplink kann wie ein DNS-Problem aussehen, ein fehlerhafter Optik-Link wie eine „Application Timeout“-Welle, und ein überlasteter Reverse-Proxy…