SPAN/ERSPAN im VXLAN-Fabric: Best Practices für PCAP

SPAN/ERSPAN im VXLAN-Fabric ist eines der wichtigsten Werkzeuge, wenn Sie für Troubleshooting oder Security-Forensik wirklich ein PCAP benötigen. Gleichzeitig ist es in Overlays deutlich anspruchsvoller als in klassischen VLAN-Topologien: Sie müssen entscheiden, ob Sie den Traffic „innerhalb“ des Overlays (inner payload) oder „außen“ im Underlay (encapsulated) spiegeln, wie Sie VTEPs, VNIs und VRFs richtig zuordnen…

RCA „Blackhole“ im Overlay: Mit Telemetrie beweisen

Ein RCA „Blackhole“ im Overlay zu schreiben ist anspruchsvoller als ein klassisches „Link down“-Postmortem, weil die sichtbaren Symptome oft nicht zur eigentlichen Ursache passen. In EVPN/VXLAN- und ähnlichen Overlay-Fabrics kann der Underlay vollständig „grün“ sein (VTEP-Reachability stabil, BGP-Sessions up), während einzelne Flows oder ganze Segmente trotzdem im Nirgendwo verschwinden. Genau das ist ein Blackhole: Pakete…

EVPN Change-Validation-Checkliste: Minimaltests vor „All Clear“

Eine EVPN Change-Validation-Checkliste ist der Unterschied zwischen „Change fertig“ und „Change wirklich sicher“. In EVPN/VXLAN-Fabrics sind viele Fehler nicht sofort sichtbar: BGP EVPN kann „up“ sein, während Route Targets falsch importiert werden; Underlay kann grün wirken, während MTU/PMTUD pfadspezifisch dropt; Multihoming kann nominal aktiv sein, aber DF-Wahl flapped erst beim nächsten Failover; und ARP/ND-Suppression kann…

Migration 100G→400G: Häufige Layer-1-Pitfalls

Die Migration 100G→400G ist für ISP-, Telco- und Datacenter-Backbones mehr als ein „einfacher Speed-Upgrade“. Auf Layer 1 ändern sich physikalische Randbedingungen spürbar: höhere Symbolraten, andere Modulationsverfahren (je nach PHY), strengere Anforderungen an Steckverbinderqualität, höhere Verlustbudgets in bestimmten Szenarien, neue Formfaktoren (QSFP-DD, OSFP) und deutlich stärkere Abhängigkeit von sauberer Verkabelung, Polarität und DOM/DDM-Interpretation. In der Praxis…

Latenz auf dem Optical Path: Warum sie sich ändert und wie man es verifiziert

Latenz auf dem Optical Path ist im Provider- und Telco-Betrieb ein unterschätztes Thema, weil viele Teams „Latenz“ automatisch als Layer-3- oder Applikationsproblem behandeln. Dabei kann sich die End-to-End-Latenz bereits auf dem optischen Transportpfad ändern – manchmal schleichend, manchmal sprunghaft nach einer Wartung, einem Re-Route im DWDM-Netz oder einer Schutzpfadumschaltung. Typische Folgen sind schwierige Kundenbeschwerden („plötzlich…

Microbend vs. Macrobend: Detection über optische Telemetrie

Microbend vs. Macrobend ist im Glasfaserbetrieb eine der häufigsten Ursachen für schleichende Degradation – und gleichzeitig eine der schwierigsten, weil sie selten als „Link down“ sichtbar wird. Stattdessen entstehen „weiche“ Symptome: Rx-Power driftet nach unten, DOM/DDM-Thresholds schlagen an, FEC-Corrected-Raten steigen, Pre-FEC-BER verschlechtert sich und erst später werden CRC-Fehler oder Paketverlust sichtbar. Für ISP/Telco-NOCs ist deshalb…

LOS vs. LOF vs. High BER: Transport-Alarme richtig interpretieren

LOS vs. LOF vs. High BER sind drei Transport-Alarme, die im NOC häufig gleichzeitig auftauchen – und trotzdem völlig unterschiedliche Ursachenebenen repräsentieren. Wer diese Alarme falsch interpretiert, verliert in Incidents wertvolle Minuten: Ein echter Fiber Cut wird wie ein „Routingproblem“ behandelt, ein LOF wird als „nur ein bisschen Fehler“ abgetan, oder High BER wird übersehen,…

Power Equalization: Channel Tilt in DWDM vermeiden

Power Equalization ist im DWDM-Betrieb eine der entscheidenden Disziplinen, um Channel Tilt zu vermeiden und damit die Signalqualität über alle Wellenlängen stabil zu halten. In der Praxis entstehen viele Transportprobleme nicht durch „harte“ Ausfälle, sondern durch schleichende Spektrumschäden: Randkanäle zeigen zuerst steigende FEC-Corrected-Raten, Pre-FEC-BER verschlechtert sich, OSNR/SNR-Reserven sinken und irgendwann treten Uncorrectables auf. Häufig liegt…

Spleißdämpfung: Wann noch okay – wann reparieren

Spleißdämpfung ist im ISP- und Telco-Betrieb eine der häufigsten Ursachen für schleichende Link-Degradation – und gleichzeitig ein Bereich, in dem „noch okay“ und „reparieren“ ohne klare Kriterien schnell zu Diskussionen führt. In der Praxis wirken Spleiße wie kleine, additive Verluststellen: Ein einzelner Spleiß mit leicht erhöhter Dämpfung fällt selten sofort auf, aber mehrere grenzwertige Spleiße…

Diverse Paths: Physische Redundanz wirklich getrennt verifizieren

Diverse Paths sind im Provider- und Telco-Betrieb ein zentraler Baustein für Verfügbarkeit: Physische Redundanz soll verhindern, dass ein einzelnes Ereignis – etwa ein Fiber Cut, ein Tiefbauunfall, eine Muffenstörung oder ein PoP-Problem – beide Pfade gleichzeitig trifft. In der Praxis ist „divers“ jedoch häufig nur auf dem Papier divers. Viele Outages entstehen genau deshalb, weil…