OSPF Neighbor Troubleshooting: MTU, Auth, Timers, Network Types

OSPF Neighbor Troubleshooting ist einer der häufigsten „Routing mit System“-Fälle im Enterprise- und Providerbetrieb, weil OSPF als IGP zwar robust ist, aber bei kleinen Inkonsistenzen sehr präzise scheitert: Nachbarschaften bleiben in INIT hängen, wechseln ständig zwischen FULL und DOWN, oder kommen gar nicht erst hoch, obwohl der Link physikalisch stabil ist. Genau hier entscheidet Methodik…

MTU/MSS Debugging: PMTUD Blackholes und Fragmentierung finden

MTU/MSS Debugging gehört zu den klassischen „mysteriösen“ Fehlerbildern im Netzwerkbetrieb: Logins funktionieren, kleine Webseiten laden, aber große Uploads hängen; ein VPN verbindet, doch bestimmte Anwendungen laufen nur sporadisch; TLS-Handshakes bleiben stehen, obwohl Ping und Traceroute „gut“ aussehen. In vielen Fällen steckt kein DNS- oder Routingproblem dahinter, sondern eine falsche Path MTU (PMTU), ein fehlerhafter MSS-Wert…

Duplex/Autoneg Issues: Klassiker auf Layer 1/2 sauber beweisen

Duplex/Autoneg Issues sind ein Klassiker auf Layer 1/2 – und genau deshalb so gefährlich: Sie treten selten als kompletter Ausfall auf, sondern als „komische“ Performanceprobleme. Anwendungen wirken langsam, VoIP knackt, Datenübertragungen brechen sporadisch ein, TCP Retransmissions steigen, aber die Link-Auslastung sieht harmlos aus. Oft liegt die Ursache in einer Duplex-Mismatch-Situation (eine Seite Full Duplex, die…

CRC/Interface Errors: Hardware, Kabel, Optics oder Congestion?

CRC/Interface Errors sind im Netzwerkbetrieb ein zweischneidiges Schwert: Einerseits liefern sie einen der klarsten Hinweise auf Probleme auf Layer 1/2, andererseits werden sie in der Praxis häufig falsch gedeutet. In Tickets liest man dann Sätze wie „CRC Errors auf dem Uplink – ist die Leitung voll?“ oder „Interface Errors steigen, wahrscheinlich Congestion“. Genau hier beginnt…

Layer-1 bis Layer-7: Systematisches Troubleshooting in komplexen Netzen

Layer-1 bis Layer-7 Troubleshooting ist in komplexen Netzen der zuverlässigste Weg, Störungen reproduzierbar zu finden und zu beheben – ohne Aktionismus und ohne „Try & Error“. Gerade in hybriden Unternehmensumgebungen mit Campus, Rechenzentrum, Cloud, SD-WAN, VPN, Firewalls, Load Balancern und mehreren Providern entstehen Symptome oft weit entfernt von ihrer Ursache: Ein fehlerhaftes Glasfaser-Patchkabel (Layer 1)…

Optical Troubleshooting: SFP DOM Werte, Dämpfung und Budget-Rechnung

Optical Troubleshooting ist eine Kernkompetenz im Betrieb moderner IT-Netzwerke, weil ein einzelnes Glasfaserproblem oft wie ein „mysteriöser“ Layer-4/7-Fehler wirkt: TCP Retransmissions steigen, VoIP jittert, Services werden sporadisch langsam – und trotzdem steht der Link auf „up“. Genau hier helfen SFP DOM Werte (Digital Optical Monitoring), eine saubere Dämpfungsanalyse und die Budget-Rechnung (Link Budget), um Fehler…

Netzwerkstörung mit System: Runbooks, Evidence und schnelle Entscheidungen

Eine Netzwerkstörung mit System zu bearbeiten ist der Unterschied zwischen „Feuerwehrmodus“ und verlässlichem Betrieb. Wenn kritische Anwendungen ausfallen, zählen Minuten: Anwender erwarten schnelle Wiederherstellung, Management verlangt klare Aussagen, und das Technikteam muss zugleich vermeiden, durch hektische Änderungen weitere Risiken zu erzeugen. Genau hier sind Runbooks, Evidence und schnelle Entscheidungen der Schlüssel. Ein gutes Runbook ist…

ARP-Probleme debuggen: ARP Flux, Cache Issues und Duplicate IPs

ARP-Probleme debuggen gehört zu den unangenehmsten Aufgaben im LAN-Betrieb, weil die Symptome oft „zufällig“ wirken: Ein Server ist mal erreichbar, mal nicht; Verbindungen brechen sporadisch ab; ein Standort meldet „DNS kaputt“, obwohl Routing sauber aussieht; oder ein Gateway scheint „unstabil“, ohne dass Link- oder Queue-Counter auffällig sind. Häufig steckt dann kein klassisches Layer-3-Problem dahinter, sondern…

“Es geht nicht”: Netzwerk-Triage Checkliste für On-Call Engineers

„Es geht nicht“ ist die häufigste, aber auch die unbrauchbarste Fehlermeldung im On-Call. Sie sagt nichts darüber aus, ob das Problem am Client, im Access-Netz, im Core, im WAN, in der Cloud, an einer Firewall oder in der Anwendung liegt. Genau deshalb brauchen On-Call Engineers eine Netzwerk-Triage Checkliste, die in wenigen Minuten aus einem vagen…

MAC-Flapping: Ursachen, Nachweise und Fixes ohne Blindflug

MAC-Flapping ist eines der deutlichsten Alarmsignale im Layer-2-Betrieb – und gleichzeitig ein häufiger Auslöser für „komische“ Störungen, die sich wie Applikationsprobleme anfühlen: sporadische Paketverluste, ARP-Probleme, instabile Gateways, VoIP-Jitter oder plötzlich wechselnde Erreichbarkeit einzelner Hosts. Der Grund ist simpel: Wenn eine MAC-Adresse innerhalb kurzer Zeit auf unterschiedlichen Switchports gelernt wird, weiß das Netzwerk nicht mehr zuverlässig,…