EVPN Multihoming: Failure Modes und Validierungs-Checkliste

EVPN Multihoming ist einer der größten operativen Vorteile von EVPN – und gleichzeitig eine der häufigsten Ursachen für schwer erklärbare Störungen, wenn Design, Konfiguration und Validierung nicht zusammenpassen. Das Versprechen klingt einfach: Ein Customer Edge (CE) oder ein Access-Switch wird redundant an zwei Provider Edge/VTEPs angebunden, ohne klassische Layer-2-Loop-Fallen, oft ohne STP-Abhängigkeit, und mit kontrolliertem…

Route Leak: Detection über Prefix Count und Monitoring

Ein Route Leak ist einer der gefährlichsten Fehler im Internet-Routing, weil er „leise“ starten und in Minuten global eskalieren kann: Plötzlich werden Routen in die falsche Richtung propagiert, Traffic nimmt unerwartete Pfade, Latenz steigt, Congestion verschiebt sich, und im schlimmsten Fall entsteht ein großflächiger Outage durch Überlast oder Blackholing. Operativ ist das Problem tückisch, weil…

EVPN-VXLAN Troubleshooting: Warum es anders ist als klassisches VLAN

EVPN-VXLAN Troubleshooting ist anders als klassisches VLAN-Troubleshooting, weil sich die Fehlerdomäne von „ein gemeinsames Layer-2-Segment“ zu einem Overlay-Transport über ein IP-Underlay verschiebt. In klassischen VLAN-Designs entstehen die meisten Probleme durch lokale Bridging-Mechanik: falsche VLAN-Zuordnung am Port, STP/Loop-Themen, MAC-Learning, Flooding, falsch gesetzte MTU oder ein defekter Trunk. In EVPN-VXLAN kommt eine zweite Welt hinzu: Das Underlay…

Route-Leak-Response-Plan: Mitigation in Minuten (Provider Runbook)

Ein Route-Leak-Response-Plan ist im Provider-Betrieb kein „Nice-to-have“, sondern eine Überlebensfunktion: Route Leaks können in wenigen Minuten weltweite Auswirkungen erzeugen, weil falsche Ankündigungen (Announcements) Trafficströme umleiten, Congestion verschieben und im Extremfall Blackholing auslösen. Das Tückische dabei: Die BGP-Session bleibt häufig stabil, Interfaces sind „up“, und trotzdem kippt die Routing-Wahrheit. Genau deshalb muss Mitigation in Minuten funktionieren…

MTU Underlay vs. Overlay: Ursache für „mysteriöse“ VXLAN-Drops

MTU Underlay vs. Overlay ist eine der häufigsten Ursachen für „mysteriöse“ VXLAN-Drops in modernen EVPN/VXLAN- und Overlay-Netzen. Das Gemeine daran: Der Dienst wirkt teilweise gesund. Kleine Pings funktionieren, Control Plane (BGP EVPN) ist stabil, ARP/ND scheint zu laufen – und trotzdem brechen Anwendungen ab, TCP zeigt Retransmissions, Datenübertragungen sind langsam oder instabil, und manche Flows…

ARP/ND Suppression in EVPN: Nutzen und operative Pitfalls

ARP/ND Suppression in EVPN ist ein zentraler Baustein moderner Overlay-Netze, weil er eines der klassischen Probleme großer Layer-2-Domänen entschärft: Flooding. In traditionellen VLAN- oder VPLS-Umgebungen werden ARP (IPv4) und Neighbor Discovery (IPv6) häufig als Broadcast bzw. Multicast über die gesamte Broadcast-Domain verteilt. Je größer die Domain, desto größer das Grundrauschen – und desto höher das…

Control Plane Policing (CoPP): CPU-Spikes im Fabric verhindern

Control Plane Policing (CoPP) ist eine der wirkungsvollsten Maßnahmen, um CPU-Spikes im Fabric zu verhindern und damit die Stabilität von Routing, EVPN/VXLAN, OAM und Management dauerhaft zu erhöhen. In modernen Spine-Leaf-Architekturen ist die Datenebene (ASIC) meist sehr robust und kann enorme Paketmengen weiterleiten – aber die Control Plane bleibt ein begrenzter, gemeinsam genutzter Ressourcenpool. Genau…

vPC/MLAG im Data Center: Split-Brain-Detection und Recovery

vPC/MLAG im Data Center ist für viele Betreiber der Standard, um Server, Storage und Edge-Systeme redundant an zwei Switches anzubinden, ohne Spanning Tree als primären Loop-Mechanismus zu benötigen. Der große Vorteil: ein aktives/aktives Uplink-Bündel (LACP) über zwei physische Geräte hinweg, hohe Verfügbarkeit und meist bessere Auslastung. Die größte operative Gefahr ist allerdings ein Fehlerzustand, der…

EVPN Route Types: Was man fürs Troubleshooting wissen muss

EVPN Route Types sind für Troubleshooting in EVPN/VXLAN-Umgebungen der schnellste Weg, um „Underlay ok, aber Service kaputt“ sauber zu erklären. In klassischen VLAN-Designs sieht man Probleme oft direkt in der Datenebene: VLAN fehlt am Trunk, STP blockt, MAC wird nicht gelernt. In EVPN wird ein großer Teil dieser „Wahrheit“ über BGP in der Control Plane…

Service Insertion im Fabric: Firewall/LB Traffic Steering (Ops Guide)

Service Insertion im Fabric ist die operative Disziplin, mit der Sie Traffic gezielt über Sicherheits- und L4–L7-Services führen, ohne die Fabric-Architektur zu „verbiegen“. Gemeint sind vor allem Firewall- und Load-Balancer-Traffic-Steering-Szenarien: Ost-West-Traffic zwischen Workloads soll durch eine Firewall-Policy, Nord-Süd-Traffic soll über einen zentralen Perimeter laufen, oder bestimmte Applikationsflüsse sollen an einem Inline-LB, einem WAF oder einem…