Modernes Transport-Monitoring ist im DWDM-Betrieb kein „nice to have“, sondern die Grundlage für stabile Verfügbarkeit, schnelle RCA und realistische Alarmierung. Wer DWDM nur über „Link up/down“ oder einzelne Vendor-Alarme überwacht, erkennt Degradation zu spät: OSNR sinkt, Channel Tilt wächst, FEC-Korrekturen steigen, Filterkaskaden werden enger, und erst wenn Uncorrectables oder LOS/LOF auftreten, wird aus schleichender Verschlechterung ein Incident. Pflicht-Telemetrie für DWDM bedeutet daher: wenige, belastbare Kernmetriken, die an den richtigen Messpunkten erfasst werden, mit Baselines und Korrelationen, die Ursachenklassen (ROADM, Amplifier, Channel Issues, Handling) schnell voneinander trennen. Gleichzeitig muss modernes Transport-Monitoring „NOC-tauglich“ sein: Alarme dürfen nicht schreien, Dashboards müssen Entscheidungen unterstützen, und Telemetrie muss in Evidence Packs und Postmortems wiederverwendbar sein. Dieser Leitfaden beschreibt, welche DWDM-Telemetrie in modernen Netzen als Pflicht gilt, wie Sie die Metriken sinnvoll strukturieren (OMS/OTS/Span/Node/Channel), welche Messpunkte den größten Nutzen liefern, wie Sie Schwellen und Trendalarme realistisch definieren und wie Sie Monitoring so aufbauen, dass es sowohl für den Tagesbetrieb als auch für große Outages zuverlässig funktioniert.
Was „Pflicht-Telemetrie“ in DWDM bedeutet
Pflicht-Telemetrie ist der kleinste Satz an Signalen, mit dem Sie die wichtigsten Failure Modes früh erkennen und sauber eingrenzen können. In DWDM sind das nicht nur optische Pegel, sondern auch Qualitätsmetriken, Regelkreis-/Power-Informationen, Pfad-Events und Umwelt-/Hardwarezustand. Ein gutes Set erfüllt vier Anforderungen:
- Frühwarnung: Degradation wird sichtbar, bevor Kundenimpact entsteht.
- Lokalisierung: Sie können zwischen Span, Node, ROADM-Filter und Kanalproblem unterscheiden.
- Stabilitätsnachweis: Nach Mitigation/Repair können Sie „wieder stabil“ belegen.
- Automatisierbarkeit: Metriken sind maschinenlesbar, trendfähig und eignen sich für Baselines.
Telemetrie-Ebenen: OMS/OTS, Node, Span und Channel sauber trennen
Ein häufiger Fehler ist, Telemetrie nur „pro Link“ zu sammeln. DWDM ist aber ein System aus Ebenen. Wenn Sie die Ebenen sauber trennen, wird RCA schneller und Alarmierung präziser.
- Channel-Ebene: alles, was pro Wellenlänge/Carrier gilt (Power, OSNR/SNR, BER, FEC, Q-Factor).
- Span-/Line-Ebene: Verstärker, Inline-Elemente, Line-Power, Gain, Tilt, Pump-Status.
- Node-/ROADM-Ebene: WSS/Filter, Add/Drop-Ports, Cross-Connects, Equalization-Profile.
- Service-/Client-Ebene: Client-Schnittstellen (Ethernet/OTN), CRC/PCS-Errors, SLA-relevante Impact-Signale.
Messpunkte: Wo Telemetrie erfasst werden sollte, damit sie operativ nützt
Die gleiche Metrik ist wertlos, wenn sie am falschen Punkt gemessen wird. Für DWDM ist es entscheidend, pro Pfad mindestens einen „Line“-Messpunkt (Span/Amplifier/ROADM-Line-Port) und einen „Service“-Messpunkt (Transponder/Client-Port) zu haben. Typische Messpunkte:
- Transponder/Coherent-Receiver: beste Sicht auf End-to-End-Qualität (SNR/Q/Pre-FEC), direkt service-relevant.
- ROADM Line Port Monitor: ideal, um Filter-/WSS- und Equalization-Probleme an Nodes zu erkennen.
- Amplifier Output/Input Monitor: entscheidend für Gain/Output-Power, Tilt, Pump- und Regelkreisprobleme.
- Add/Drop Port Monitor: erkennt falsche Launch Levels, Add-Imbalance und lokale Kanalprobleme.
Pflicht-Metriken Kategorie 1: Per-Channel Power und Power-Profil (inkl. Tilt)
Ohne per-channel Power sehen Sie viele DWDM-Probleme zu spät. Power ist nicht nur „Pegel“, sondern Grundlage für Equalization, Tilt-Vermeidung und Nonlinearity-Checks.
- Channel Rx Power (dBm): am Transponder und möglichst an ROADM/Line-Monitorpunkten.
- Channel Tx/Launch Power (dBm): pro Kanal am Add-Port/Transponder, um zu laute/leise Adds zu erkennen.
- Per-band oder per-channel Tilt: Schieflage über Spektrum, besonders wichtig bei EDFA-Ketten.
- Power Targets/Offsets: Sollwerte und Abweichungen (für RCA und Change-Validierung).
Tilt als Basiskennzahl (MathML)
Warum Power alleine nicht reicht
- Zu leise: OSNR/SNR sinkt, FEC steigt.
- Zu laut: Nichtlinearitäten steigen, Nachbarkanäle werden gestört, SNR/Q sinkt trotz „guter“ Power.
- Ungleichmäßig: Randkanäle kippen zuerst, Incidents wirken „random“.
Pflicht-Metriken Kategorie 2: Signalqualität (OSNR, SNR/Q-Factor) und ihre Grenzen
DWDM-Qualität ist mehr als Pegel. Moderne kohärente Systeme liefern SNR/Q-Factor (DSP-basiert) und oft zusätzlich OSNR (optisch gemessen oder abgeleitet). Diese Metriken sind essenziell, um noise-limited und nonlinearity-limited Failure Modes zu unterscheiden.
- OSNR (dB): besonders relevant für ASE/Amplifier-Noise und lange Ketten.
- SNR/Q-Factor: oft der beste Frühindikator in kohärenten Systemen, weil er Filter- und Nichtlinearitätseffekte sichtbar macht.
- FEC Margin: Abstand zur FEC-Grenze (falls verfügbar), sehr nützlich für „wie nah am Kipp-Punkt“.
Für grundlegende Rahmenbedingungen in optischen Ethernet-Kontexten ist IEEE 802.3 hilfreich; für Fasergrundlagen ITU-T G.652.
Pflicht-Metriken Kategorie 3: BER und FEC – Frühwarnung und Hard Stops
BER/FEC sind die zuverlässigsten Brückenmetriken zwischen „Optik wird schlechter“ und „Service wird schlecht“. Wichtig ist, Pre-FEC und Post-FEC sauber zu trennen und Zähler als Raten zu betrachten.
- Pre-FEC BER: empfindlich, ideal für Drift/Frühwarnung.
- Post-FEC BER: service-relevant; wenn er steigt, ist es meist bereits kritisch.
- FEC Corrected Rate: Korrekturaufwand pro Zeitfenster; perfekter Trendindikator.
- FEC Uncorrectables: Hard-Stop; deutet auf Nutzdatenfehler hin.
BER und FEC-Raten (MathML)
Pflicht-Metriken Kategorie 4: Amplifier-/Span-Telemetrie (Gain, Output, Pump, Tilt)
Viele DWDM-Probleme sind span- oder amplifiergetrieben und betreffen mehrere Kanäle gleichzeitig. Wenn Sie nur Transponderwerte monitoren, sehen Sie das „Endresultat“, aber nicht die Ursache. Pflichtsignale auf Span-Ebene:
- EDFA Gain und Output Power: Soll/Ist, Drift, Regelkreise (AGC/ACC).
- Pump Status und Pump Current: Indikatoren für bevorstehenden Defekt oder Instabilität.
- Input Power: zu niedrige Input-Power verschlechtert OSNR und destabilisiert Regelung.
- Span Loss/Attenuation Indicators: wenn Plattform das ableitet, sehr hilfreich für Drift.
- Tilt/Flattening Status: ob Equalization aktiv ist und wie stabil sie arbeitet.
Pflicht-Metriken Kategorie 5: ROADM/WSS und Path-Events (die häufigste RCA-Abkürzung)
ROADM-Probleme sind oft nicht „kaputt“, sondern „falsch eingestellt“ oder „kaskadiert“. Um das zu erkennen, brauchen Sie Telemetrie, die Pfadänderungen und Filterzustände sichtbar macht. Pflichtsignale:
- Path/Route State: welche Nodes und Directions sind im aktuellen Pfad?
- WSS-Profile/Passband-Info: Zielbandbreite, Kanalmitte, Profile-Version (falls verfügbar).
- Add/Drop Events: Channel Add/Drop, Re-route, Direction Changes mit Zeitstempel.
- Node Power Equalization: per-channel Attenuation/Offsets, Abweichung vom Target.
In RCAs ist oft der wichtigste Satz: „Pfad hat sich um 02:14 UTC geändert“ – ohne Path-Events bleibt das Spekulation. Deshalb gehört Event-Telemetrie zur Pflicht.
Pflicht-Metriken Kategorie 6: Client-/Service-Layer Telemetrie als Impact-Lens
DWDM-Monitoring darf nicht nur „optisch“ sein. Sie brauchen eine Service-Lens, die zeigt, ob Degradation bereits auf die Kundenerfahrung wirkt. Das ist auch für Alarm-Priorisierung entscheidend.
- Ethernet/PCS/CRC Errors: zeigt, ob Fehler die Paketebene erreichen.
- Interface Flaps/LOS/LOF: harte Zustandswechsel, wichtig für Incident-Severity.
- Traffic/Utilization auf Schutzpfaden: wenn ein DWDM-Problem Failover auslöst, entstehen Congestion-Risiken.
- Aktive Messung (optional, aber stark): OWAMP/TWAMP für Delay/Loss, wenn SLA/Latency kritisch ist (siehe RFC 4656 und RFC 5357).
Pflicht-Metriken Kategorie 7: Umwelt- und Hardware-Health (damit Sie Drift erklären können)
Viele „mysteriöse“ DWDM-Probleme korrelieren mit Umwelt- oder Hardwarezustand: Temperaturdrift, PSU-Probleme, Fan-Fail, feuchte PoPs. Diese Daten sind oft der Schlüssel zur schnellen Eingrenzung.
- Temperatur (Chassis/Module/PoP): Trend und Hotspots; wichtig für Laserdrift und Stabilität.
- PSU/Fan Status: drohende Hardwareausfälle früh erkennen.
- Optik DOM/DDM: Bias, Voltage, Tx/Rx – besonders als Trend, weniger als harte Grenzwerte.
Baselines und Thresholds: Damit Monitoring nicht „schreit“
Die beste Telemetrie nützt nichts, wenn Alarmierung falsch gebaut ist. DWDM-Werte unterscheiden sich je nach Pfad, Modulation und Kanalplan. Deshalb sollten Sie Baselines pro Kanal/Pfad oder zumindest pro Optik-/Serviceklasse aufbauen und Alarme überwiegend als Abweichung (Delta) definieren.
Delta-Logik als Standard (MathML)
- Dauerbedingung: Alarm erst, wenn Abweichung über X Minuten anhält.
- Hysterese: Clear erst, wenn Werte wieder stabil im Normalband sind.
- Composite Alerts: z. B. Tilt + steigende FEC-Rate ist relevanter als Tilt allein.
Dashboards, die wirklich helfen: Pflicht-Views für DWDM
Ein modernes Transport-Dashboard muss nicht schön sein, sondern entscheidungsfähig. Folgende Views sind im Betrieb besonders nützlich:
- Per-Path Health Summary: Top-Kanäle nach FEC-Drift, SNR/Q, Uncorrectables.
- Spectrum View: per-channel Power über Frequenz (Tilt sichtbar), inklusive Targets.
- Span/Amplifier View: Gain/Output/Inputs, Pump-Status, Tilt/Flattening pro Span.
- ROADM Event Timeline: Add/Drop/Re-route Events mit Zeitstempeln, korrelierbar mit Qualitätsdrift.
- Service Impact Lens: CRC/Errors, Flaps, Traffic Shifts, Latenz/Loss (wenn kritisch).
Evidence Pack Standard: DWDM-Checkliste für Incident und RCA
Pflicht-Telemetrie ist besonders wertvoll, wenn sie als Evidence Pack standardisiert wird. So müssen Teams im Incident nicht „alles suchen“, sondern haben einen festen Satz an Daten.
- Identifikatoren: Pfad/Route, Nodes/Spans, Kanalplan (Frequenzen), A/Z-Ende.
- Zeitfenster (UTC): Start/Peak/aktuell, plus Vorher-Vergleich.
- Channel Telemetry: Power, OSNR/SNR/Q, Pre-FEC, FEC Corrected/Uncorrected.
- Span Telemetry: Gain/Output/Input, Tilt, Pump/Temp/PSU.
- ROADM Events: Add/Drop/Re-route, Profile-Änderungen, Direction Changes.
- Service Lens: CRC/Errors, LOS/LOF, Traffic/Delay/Loss.
Outbound-Ressourcen
- IEEE 802.3 (Ethernet-Standards, PHY/PCS/FEC-Kontext)
- ITU-T G.652 (Single-mode optical fibre and cable)
- RFC 4656: OWAMP (One-Way Active Measurement Protocol)
- RFC 5357: TWAMP (Two-Way Active Measurement Protocol)
- EXFO Resources (Optical Test & Monitoring)
- VIAVI: OTDR Solutions (Feldmessung und Monitoringkonzepte)
Cisco Netzwerkdesign, CCNA Support & Packet Tracer Projekte
Cisco Networking • CCNA • Packet Tracer • Network Configuration
Ich biete professionelle Unterstützung im Bereich Cisco Computer Networking, einschließlich CCNA-relevanter Konfigurationen, Netzwerkdesign und komplexer Packet-Tracer-Projekte. Die Lösungen werden praxisnah, strukturiert und nach aktuellen Netzwerkstandards umgesetzt.
Diese Dienstleistung eignet sich für Unternehmen, IT-Teams, Studierende sowie angehende CCNA-Kandidaten, die fundierte Netzwerkstrukturen planen oder bestehende Infrastrukturen optimieren möchten. Finden Sie mich auf Fiverr.
Leistungsumfang:
-
Netzwerkdesign & Topologie-Planung
-
Router- & Switch-Konfiguration (Cisco IOS)
-
VLAN, Inter-VLAN Routing
-
OSPF, RIP, EIGRP (Grundlagen & Implementierung)
-
NAT, ACL, DHCP, DNS-Konfiguration
-
Troubleshooting & Netzwerkoptimierung
-
Packet Tracer Projektentwicklung & Dokumentation
-
CCNA Lern- & Praxisunterstützung
Lieferumfang:
-
Konfigurationsdateien
-
Packet-Tracer-Dateien (.pkt)
-
Netzwerkdokumentation
-
Schritt-für-Schritt-Erklärungen (auf Wunsch)
Arbeitsweise:Strukturiert • Praxisorientiert • Zuverlässig • Technisch fundiert
CTA:
Benötigen Sie professionelle Unterstützung im Cisco Networking oder für ein CCNA-Projekt?
Kontaktieren Sie mich gerne für eine Projektanfrage oder ein unverbindliches Gespräch. Finden Sie mich auf Fiverr.












