EVPN Route Types: Was man fürs Troubleshooting wissen muss

EVPN Route Types sind für Troubleshooting in EVPN/VXLAN-Umgebungen der schnellste Weg, um „Underlay ok, aber Service kaputt“ sauber zu erklären. In klassischen VLAN-Designs sieht man Probleme oft direkt in der Datenebene: VLAN fehlt am Trunk, STP blockt, MAC wird nicht gelernt. In EVPN wird ein großer Teil dieser „Wahrheit“ über BGP in der Control Plane…

Service Insertion im Fabric: Firewall/LB Traffic Steering (Ops Guide)

Service Insertion im Fabric ist die operative Disziplin, mit der Sie Traffic gezielt über Sicherheits- und L4–L7-Services führen, ohne die Fabric-Architektur zu „verbiegen“. Gemeint sind vor allem Firewall- und Load-Balancer-Traffic-Steering-Szenarien: Ost-West-Traffic zwischen Workloads soll durch eine Firewall-Policy, Nord-Süd-Traffic soll über einen zentralen Perimeter laufen, oder bestimmte Applikationsflüsse sollen an einem Inline-LB, einem WAF oder einem…

Multi-Tenant-Fabric: Sichere Segmentierung mit VRF + EVPN

Eine Multi-Tenant-Fabric verlangt sichere Segmentierung, die nicht nur auf dem Papier funktioniert, sondern auch im Betrieb belastbar bleibt: klare Isolation zwischen Mandanten, kontrollierte Kommunikation über definierte Übergänge und ein Troubleshooting-Ansatz, der bei Incidents nicht im Chaos endet. In modernen Data-Center-Architekturen ist dafür die Kombination aus VRF und EVPN besonders etabliert. VRFs schaffen logische Routing-Isolation (Layer…

Multi-Vendor-EVPN-Interop: Häufigste Probleme und wie man testet

Multi-Vendor-EVPN-Interop ist in der Praxis kein „einmal konfigurieren und vergessen“-Thema, sondern ein wiederkehrendes Ops-Risiko: Zwei Geräte sprechen zwar beide EVPN und VXLAN, aber sie interpretieren Details unterschiedlich, haben abweichende Defaults oder unterstützen bestimmte Optionen nur teilweise. Das Resultat sind Störungen, die im NOC wie „mysteriös“ wirken: BGP EVPN ist up, Underlay ist grün, trotzdem fehlt…

L2-Extension-Risiko: Wann VLAN-Stretch zur Katastrophe wird

L2-Extension-Risiko beschreibt die operativen und architektonischen Gefahren, die entstehen, wenn Sie ein VLAN (oder eine Layer-2-Broadcast-Domain) über größere Bereiche „stretchen“ – etwa über mehrere Racks, Pods, Datacenter oder sogar Metropolregionen. VLAN-Stretch kann kurzfristig attraktiv wirken: keine IP-Änderungen bei Migrationen, einfache Applikationsannahmen, „alles ist im gleichen Subnet“. Genau diese Einfachheit wird jedoch schnell zur Katastrophe, sobald…

SPAN/ERSPAN im VXLAN-Fabric: Best Practices für PCAP

SPAN/ERSPAN im VXLAN-Fabric ist eines der wichtigsten Werkzeuge, wenn Sie für Troubleshooting oder Security-Forensik wirklich ein PCAP benötigen. Gleichzeitig ist es in Overlays deutlich anspruchsvoller als in klassischen VLAN-Topologien: Sie müssen entscheiden, ob Sie den Traffic „innerhalb“ des Overlays (inner payload) oder „außen“ im Underlay (encapsulated) spiegeln, wie Sie VTEPs, VNIs und VRFs richtig zuordnen…

RCA „Blackhole“ im Overlay: Mit Telemetrie beweisen

Ein RCA „Blackhole“ im Overlay zu schreiben ist anspruchsvoller als ein klassisches „Link down“-Postmortem, weil die sichtbaren Symptome oft nicht zur eigentlichen Ursache passen. In EVPN/VXLAN- und ähnlichen Overlay-Fabrics kann der Underlay vollständig „grün“ sein (VTEP-Reachability stabil, BGP-Sessions up), während einzelne Flows oder ganze Segmente trotzdem im Nirgendwo verschwinden. Genau das ist ein Blackhole: Pakete…

EVPN Change-Validation-Checkliste: Minimaltests vor „All Clear“

Eine EVPN Change-Validation-Checkliste ist der Unterschied zwischen „Change fertig“ und „Change wirklich sicher“. In EVPN/VXLAN-Fabrics sind viele Fehler nicht sofort sichtbar: BGP EVPN kann „up“ sein, während Route Targets falsch importiert werden; Underlay kann grün wirken, während MTU/PMTUD pfadspezifisch dropt; Multihoming kann nominal aktiv sein, aber DF-Wahl flapped erst beim nächsten Failover; und ARP/ND-Suppression kann…

Migration 100G→400G: Häufige Layer-1-Pitfalls

Die Migration 100G→400G ist für ISP-, Telco- und Datacenter-Backbones mehr als ein „einfacher Speed-Upgrade“. Auf Layer 1 ändern sich physikalische Randbedingungen spürbar: höhere Symbolraten, andere Modulationsverfahren (je nach PHY), strengere Anforderungen an Steckverbinderqualität, höhere Verlustbudgets in bestimmten Szenarien, neue Formfaktoren (QSFP-DD, OSFP) und deutlich stärkere Abhängigkeit von sauberer Verkabelung, Polarität und DOM/DDM-Interpretation. In der Praxis…

Latenz auf dem Optical Path: Warum sie sich ändert und wie man es verifiziert

Latenz auf dem Optical Path ist im Provider- und Telco-Betrieb ein unterschätztes Thema, weil viele Teams „Latenz“ automatisch als Layer-3- oder Applikationsproblem behandeln. Dabei kann sich die End-to-End-Latenz bereits auf dem optischen Transportpfad ändern – manchmal schleichend, manchmal sprunghaft nach einer Wartung, einem Re-Route im DWDM-Netz oder einer Schutzpfadumschaltung. Typische Folgen sind schwierige Kundenbeschwerden („plötzlich…