Ethernet OAM (802.1ag/Y.1731): Faults auf Layer 2 lokalisieren

Das Hauptkeyword „Ethernet OAM (802.1ag/Y.1731)“ steht im Provider- und Metro-Ethernet-Betrieb für einen entscheidenden Unterschied zwischen „Link ist up“ und „Service ist gesund“: Mit Connectivity- und Performance-OAM lassen sich Faults auf Layer 2 gezielt lokalisieren, statt im Incident nur Symptome zu jagen. Gerade in geteilten Infrastrukturen (Aggregation, QinQ, E-Line/E-LAN, Carrier-Interconnects) sind klassische Werkzeuge wie Ping oder…

Service Activation Test für Metro-E: OSI-Checkliste L1–L3

Ein „Service Activation Test für Metro-E“ ist der Moment, in dem aus einer bestellten Leitung ein belastbarer, messbarer und betriebssicherer Dienst wird. Gerade im Metro-Ethernet-Umfeld (E-Line, E-LAN, E-Tree, QinQ, NNI/UNI) reicht es nicht, dass ein Port „up“ ist oder dass ein einzelner Ping funktioniert. Aktivierung bedeutet, dass die gesamte Service-Kette – vom optischen Link über…

NNI/UNI-Design: Misconfig-Risiken auf Layer 2 reduzieren

Das Hauptkeyword „NNI/UNI-Design“ beschreibt im Metro- und Provider-Ethernet eine der wichtigsten Stellschrauben, um Misconfig-Risiken auf Layer 2 systematisch zu reduzieren. Denn die meisten großflächigen L2-Störungen entstehen nicht durch exotische Bugs, sondern durch alltägliche Inkonsistenzen an Übergabepunkten: falsche VLAN-Listen, vertauschtes Tagging (untagged vs. tagged), inkorrekte QinQ-Profile, MTU-Überraschungen, unklare Transparenzregeln für Control-Frames oder ein LAG, dessen Member…

EVPN als „L2 Control Plane“: Warum Operatoren auf EVPN wechseln

Das Hauptkeyword „EVPN als L2 Control Plane“ beschreibt einen Paradigmenwechsel, den viele Operatoren (Telcos, ISPs, Cloud- und Datacenter-Betreiber) in den letzten Jahren vollzogen haben: Weg von rein datengetriebenem Flood-and-Learn-Ethernet hin zu einem kontrollierten, signalisierten Layer-2/Layer-3-Overlay, das sich wie eine echte Control Plane verhält. Klassische L2-Domänen skalieren nur begrenzt, weil sie auf Broadcasts, Unknown-Unicast-Flooding, MAC-Learning und…

ISP Layer 3: IGP-Stabilität und Routing-Hygiene

Das Hauptkeyword „ISP Layer 3“ steht im Provider-Alltag für das Rückgrat jeder Dienstqualität: Wenn das IGP instabil ist, wird alles darüber unzuverlässig – unabhängig davon, wie gut Access, L2 oder optische Links aussehen. IGP-Stabilität und Routing-Hygiene sind daher kein „Nice to have“, sondern die Grundlage für niedrige MTTR, planbare Changes und belastbare SLAs. In der…

OSPF vs. IS-IS fürs Backbone: Betrieb, Konvergenz und Risiken

Das Hauptkeyword „OSPF vs. IS-IS fürs Backbone“ taucht in ISP- und Telco-Teams immer dann auf, wenn es um mehr geht als Protokoll-Religion: Betriebssicherheit, Konvergenzverhalten und das Risiko großer Routing-Incidents hängen im Backbone stark davon ab, wie sauber das IGP designt und operationalisiert ist. OSPF und IS-IS sind beide Link-State-Protokolle, beide können in großen Netzen stabil…

BGP am Edge: Filtering, Route-Leak-Impact und Best Practices

Das Hauptkeyword „BGP am Edge“ steht in Provider- und Enterprise-Backbones für den kritischsten Übergabepunkt zwischen Verantwortungssphären: hier treffen Kunden, Peers, Upstreams, Internet Exchanges und interne Domänen aufeinander. Genau an dieser Stelle entstehen die folgenschwersten Routing-Incidents – nicht weil BGP „unsicher“ wäre, sondern weil BGP bewusst flexibel ist und deshalb konsequenten Schutz braucht. Ohne sauberes Filtering,…

Peering-Incident: Sicherstellen, ob das Problem im Interconnect oder Transit liegt

Ein „Peering-Incident“ wirkt im NOC oft wie ein einziges Symptom („Kunde erreicht Ziel X nicht“), kann aber zwei sehr unterschiedliche Ursachen haben: ein Problem im Interconnect (also am direkten Peering-Link, am IX-Port, am Cross-Connect, am L2/L3-Edge) oder ein Problem im Transit (Upstream-Path, Provider-Core, Remote-Policy, externe Störung außerhalb des direkten Peering-Pfads). Genau hier entscheidet sich, ob…

MPLS/EVPN-Outages auf OSI-Layer mappen: So schreibt man ein sauberes RCA

Das Hauptkeyword „MPLS/EVPN-Outages auf OSI-Layer mappen“ beschreibt eine Methode, die in Carrier-, ISP- und Data-Center-Netzen besonders zuverlässig funktioniert: Störungen in MPLS- und EVPN-Umgebungen werden nicht nur als „Routing kaputt“ oder „Overlay down“ beschrieben, sondern sauber entlang der OSI-Schichten eingeordnet. Genau diese Einordnung ist der Schlüssel zu einer belastbaren Root Cause Analysis (RCA). In der Praxis…

Migration 10G/100G/400G: L1-Risiken, die Upgrades scheitern lassen

Das Hauptkeyword „Migration 10G/100G/400G“ steht in Provider- und Data-Center-Netzen selten für eine reine Kapazitätserhöhung, sondern für einen anspruchsvollen Layer-1-Wechsel mit neuen Toleranzen, engeren Margins und deutlich höherer Empfindlichkeit gegenüber „kleinen“ physikalischen Problemen. Upgrades scheitern in der Praxis nicht an Routing oder VLANs, sondern an optischen Details: falsche Optikklasse, zu knappes Power Budget, verschmutzte Steckverbinder, zu…