Multi-Vendor-EVPN-Interop: Häufigste Probleme und wie man testet

Multi-Vendor-EVPN-Interop ist in der Praxis kein „einmal konfigurieren und vergessen“-Thema, sondern ein wiederkehrendes Ops-Risiko: Zwei Geräte sprechen zwar beide EVPN und VXLAN, aber sie interpretieren Details unterschiedlich, haben abweichende Defaults oder unterstützen bestimmte Optionen nur teilweise. Das Resultat sind Störungen, die im NOC wie „mysteriös“ wirken: BGP EVPN ist up, Underlay ist grün, trotzdem fehlt…

L2-Extension-Risiko: Wann VLAN-Stretch zur Katastrophe wird

L2-Extension-Risiko beschreibt die operativen und architektonischen Gefahren, die entstehen, wenn Sie ein VLAN (oder eine Layer-2-Broadcast-Domain) über größere Bereiche „stretchen“ – etwa über mehrere Racks, Pods, Datacenter oder sogar Metropolregionen. VLAN-Stretch kann kurzfristig attraktiv wirken: keine IP-Änderungen bei Migrationen, einfache Applikationsannahmen, „alles ist im gleichen Subnet“. Genau diese Einfachheit wird jedoch schnell zur Katastrophe, sobald…

SPAN/ERSPAN im VXLAN-Fabric: Best Practices für PCAP

SPAN/ERSPAN im VXLAN-Fabric ist eines der wichtigsten Werkzeuge, wenn Sie für Troubleshooting oder Security-Forensik wirklich ein PCAP benötigen. Gleichzeitig ist es in Overlays deutlich anspruchsvoller als in klassischen VLAN-Topologien: Sie müssen entscheiden, ob Sie den Traffic „innerhalb“ des Overlays (inner payload) oder „außen“ im Underlay (encapsulated) spiegeln, wie Sie VTEPs, VNIs und VRFs richtig zuordnen…

RCA „Blackhole“ im Overlay: Mit Telemetrie beweisen

Ein RCA „Blackhole“ im Overlay zu schreiben ist anspruchsvoller als ein klassisches „Link down“-Postmortem, weil die sichtbaren Symptome oft nicht zur eigentlichen Ursache passen. In EVPN/VXLAN- und ähnlichen Overlay-Fabrics kann der Underlay vollständig „grün“ sein (VTEP-Reachability stabil, BGP-Sessions up), während einzelne Flows oder ganze Segmente trotzdem im Nirgendwo verschwinden. Genau das ist ein Blackhole: Pakete…

EVPN Change-Validation-Checkliste: Minimaltests vor „All Clear“

Eine EVPN Change-Validation-Checkliste ist der Unterschied zwischen „Change fertig“ und „Change wirklich sicher“. In EVPN/VXLAN-Fabrics sind viele Fehler nicht sofort sichtbar: BGP EVPN kann „up“ sein, während Route Targets falsch importiert werden; Underlay kann grün wirken, während MTU/PMTUD pfadspezifisch dropt; Multihoming kann nominal aktiv sein, aber DF-Wahl flapped erst beim nächsten Failover; und ARP/ND-Suppression kann…

Migration 100G→400G: Häufige Layer-1-Pitfalls

Die Migration 100G→400G ist für ISP-, Telco- und Datacenter-Backbones mehr als ein „einfacher Speed-Upgrade“. Auf Layer 1 ändern sich physikalische Randbedingungen spürbar: höhere Symbolraten, andere Modulationsverfahren (je nach PHY), strengere Anforderungen an Steckverbinderqualität, höhere Verlustbudgets in bestimmten Szenarien, neue Formfaktoren (QSFP-DD, OSFP) und deutlich stärkere Abhängigkeit von sauberer Verkabelung, Polarität und DOM/DDM-Interpretation. In der Praxis…

Latenz auf dem Optical Path: Warum sie sich ändert und wie man es verifiziert

Latenz auf dem Optical Path ist im Provider- und Telco-Betrieb ein unterschätztes Thema, weil viele Teams „Latenz“ automatisch als Layer-3- oder Applikationsproblem behandeln. Dabei kann sich die End-to-End-Latenz bereits auf dem optischen Transportpfad ändern – manchmal schleichend, manchmal sprunghaft nach einer Wartung, einem Re-Route im DWDM-Netz oder einer Schutzpfadumschaltung. Typische Folgen sind schwierige Kundenbeschwerden („plötzlich…

Microbend vs. Macrobend: Detection über optische Telemetrie

Microbend vs. Macrobend ist im Glasfaserbetrieb eine der häufigsten Ursachen für schleichende Degradation – und gleichzeitig eine der schwierigsten, weil sie selten als „Link down“ sichtbar wird. Stattdessen entstehen „weiche“ Symptome: Rx-Power driftet nach unten, DOM/DDM-Thresholds schlagen an, FEC-Corrected-Raten steigen, Pre-FEC-BER verschlechtert sich und erst später werden CRC-Fehler oder Paketverlust sichtbar. Für ISP/Telco-NOCs ist deshalb…

LOS vs. LOF vs. High BER: Transport-Alarme richtig interpretieren

LOS vs. LOF vs. High BER sind drei Transport-Alarme, die im NOC häufig gleichzeitig auftauchen – und trotzdem völlig unterschiedliche Ursachenebenen repräsentieren. Wer diese Alarme falsch interpretiert, verliert in Incidents wertvolle Minuten: Ein echter Fiber Cut wird wie ein „Routingproblem“ behandelt, ein LOF wird als „nur ein bisschen Fehler“ abgetan, oder High BER wird übersehen,…

Power Equalization: Channel Tilt in DWDM vermeiden

Power Equalization ist im DWDM-Betrieb eine der entscheidenden Disziplinen, um Channel Tilt zu vermeiden und damit die Signalqualität über alle Wellenlängen stabil zu halten. In der Praxis entstehen viele Transportprobleme nicht durch „harte“ Ausfälle, sondern durch schleichende Spektrumschäden: Randkanäle zeigen zuerst steigende FEC-Corrected-Raten, Pre-FEC-BER verschlechtert sich, OSNR/SNR-Reserven sinken und irgendwann treten Uncorrectables auf. Häufig liegt…