Keepalive & Idle Timeout: Tuning ohne die App zu brechen

Keepalive & Idle Timeout gehören zu den Stellschrauben, die im Betrieb schnell „mal eben“ angepasst werden – und genau deshalb so häufig Incidents auslösen. Ein zu kurzer Idle Timeout kappt scheinbar stabile Verbindungen (VPN, API-Gateways, Datenbank-Pools, gRPC, WebSockets), während ein zu langer Timeout Ressourcen bindet (Conntrack, NAT-Ports, Session-Tabellen, File Descriptors) und damit Ausfälle durch Erschöpfung…

Langsamer TLS-Handshake: Problem in L4, L6 oder L7?

Ein langsamer TLS-Handshake fällt im Betrieb oft erst dann auf, wenn Nutzer bereits „Spinner“ sehen: Login dauert zu lange, APIs reagieren träge, Mobile Apps hängen beim Start oder nur bestimmte Regionen melden Timeouts. Gleichzeitig zeigen klassische Metriken wie CPU-Auslastung oder Interface-Errors häufig kein eindeutiges Bild. Genau hier entsteht das typische Rätselraten: Liegt das Problem im…

QUIC/HTTP3 in der Praxis: Debugging-Herausforderungen fürs NOC

QUIC und HTTP/3 sind in der Praxis längst keine „Zukunftstechnologien“ mehr: Moderne Browser, Mobile Apps und große Plattformen nutzen sie standardmäßig, um Latenz zu senken und Verbindungen robuster zu machen. Gleichzeitig entsteht für Operations-Teams ein neues Problemfeld: Wenn Nutzer melden, dass „eine Seite langsam“ ist oder „nur manche Requests fehlschlagen“, lässt sich das nicht mehr…

Layer 5 (Session): Sticky-Session-Failure – trügerische Symptome

Ein Sticky-Session-Failure ist einer der frustrierendsten Incident-Typen im Betrieb: Die Anwendung wirkt „teilweise kaputt“, Fehlermeldungen wechseln scheinbar zufällig, und klassische Netzwerkchecks liefern keine klaren Hinweise. Nutzer melden zum Beispiel, dass Login mal funktioniert und mal nicht, dass Warenkörbe verschwinden, dass Uploads sporadisch abbrechen oder dass nach einem Redirect plötzlich „unauthorized“ erscheint. Oft wird zunächst in…

Session Drops bei VDI/Citrix: OSI-Ansatz zur Problem-Isolation

Session Drops bei VDI/Citrix gehören zu den störanfälligsten Incident-Typen im Enterprise-Betrieb: Nutzer berichten von abrupten Abbrüchen, eingefrorenen Bildschirmen, „Reconnecting…“-Schleifen oder plötzlich verschwundenen Sitzungen – oft ohne klaren Fehlercode. Das Tückische ist, dass VDI-Umgebungen (Citrix Virtual Apps and Desktops, Citrix DaaS, Remote Desktop Services/AVD und vergleichbare VDI-Stacks) mehrere Protokoll- und Infrastrukturkomponenten kombinieren: Client-Gerät, LAN/WLAN, WAN/VPN, NAT/Firewall,…

Kerberos/LDAP-Session-Timeout: Troubleshooting von Network bis App

Ein Kerberos/LDAP-Session-Timeout ist in der Praxis selten ein einzelner Fehler – meist ist es eine Kette aus Zeitdrift, DNS-SRV-Auflösung, Netzwerkpfad, Firewall-Policies, Ticket-Lifetimes und Applikations-Session-Handling. Genau deshalb wirken die Symptome oft trügerisch: Nutzer werden „zufällig“ abgemeldet, Single Sign-on klappt morgens, bricht aber nachmittags, Anwendungen melden „KDC unreachable“, „Clock skew too great“, „LDAP bind failed“ oder schlicht…

„Ständiges Neu-Login“ in Enterprise-Apps: Session vs. Cookie vs. LB

„Ständiges Neu-Login“ in Enterprise-Apps ist eines dieser Symptome, bei denen sich Nutzer und Betriebsteams schnell gegenseitig missverstehen: Aus Nutzersicht ist es ein permanentes Abmelden, aus Sicht des NOC oder der Plattform ist „doch alles erreichbar“, und aus Sicht des Security-Teams ist es möglicherweise eine Folge von Policy-Änderungen. In der Praxis steckt dahinter meist keine einzelne…

Stateful Firewall & Sessions: Warum asymmetrisches Routing zur Katastrophe wird

Eine stateful Firewall ist in Enterprise-Netzen der Normalfall: Sie erlaubt oder blockiert Verbindungen nicht nur anhand statischer Regeln, sondern verfolgt aktiv den Zustand einer Session in einer Zustands- oder Conntrack-Tabelle. Das funktioniert hervorragend – bis asymmetrisches Routing ins Spiel kommt. Dann passiert oft das Unvermeidliche: Der Hinweg eines Datenstroms läuft durch Firewall A, der Rückweg…

MAC-Flapping: Häufige Ursachen und wie du es belegst

MAC-Flapping gehört zu den häufigsten und zugleich am meisten missverstandenen Layer-2-Symptomen in produktiven Netzwerken. Im Ticket steht dann oft nur „MAC flapping detected“ oder „MAC move“, und innerhalb weniger Minuten eskaliert die Lage: Trunks sind überlastet, Unknown-Unicast-Flooding steigt, einzelne VLANs wirken „instabil“, und Anwendungen melden Timeouts oder sporadische Verbindungsabbrüche. Dabei ist MAC-Flapping nicht automatisch ein…

IPv6-Incident-Playbook: ND, RA und Dual-Stack-Edge-Cases

Ein sauberes IPv6-Incident-Playbook ist heute Pflicht, weil IPv6-Ausfälle selten „hart“ wirken: Oft ist nur ein Teil der Clients betroffen, nur bestimmte Subnetze verlieren Konnektivität, oder Anwendungen „flappen“ zwischen IPv4 und IPv6. Besonders häufig liegen die Ursachen nicht im Routing, sondern in den Mechanismen am Rand des Netzes: Neighbor Discovery (ND), Router Advertisements (RA) und typische…