IGP Design: OSPF vs. IS-IS in Telco Backbones – Expertenvergleich

IGP Design: OSPF vs. IS-IS in Telco Backbones ist eine der zentralen Architekturentscheidungen im Carrier-Umfeld, weil das Interior Gateway Protocol (IGP) die Stabilität, Konvergenz und Skalierbarkeit des gesamten Transportnetzes mitbestimmt. Im Backbone gilt: Der Core soll „langweilig“ sein – vorhersehbare Pfade, klare Failure Domains, robuste Wiederherstellung und möglichst wenig Kontrollplan-Überraschungen. Genau dafür ist das IGP da: Es verteilt Topologieinformationen, berechnet Kürzestpfade und liefert die Basis für MPLS/SR, Traffic Engineering, Fast Reroute und zuverlässige Multi-Region-Konnektivität. OSPF und IS-IS können beide Carrier-Grade Netze tragen, unterscheiden sich aber in Domänenmodell, Adressierungs- und Erweiterungslogik, Betriebsgewohnheiten und in typischen Skalierungs-Patterns. In der Praxis ist die „richtige“ Wahl selten eine reine Featurefrage – sie hängt von Topologie, Organisationsstruktur, Migrationspfaden, Telemetry-Ansprüchen und der Frage ab, wie stark Sie Hierarchien und Summarization nutzen wollen. Dieser Expertenvergleich erklärt verständlich, worin OSPF und IS-IS sich in Telco-Backbones unterscheiden, welche Designhebel wirklich zählen und wie Sie ein IGP so bauen, dass es Wachstum, Segment Routing und Betriebskosten gleichermaßen unterstützt.

Was ein IGP im Telco-Backbone leisten muss

Bevor man OSPF und IS-IS vergleicht, lohnt sich ein Blick auf die Anforderungen. In Carrier-Backbones ist ein IGP nicht „einfach Routing“, sondern die Grundlage für deterministische Pfade, schnelle Wiederherstellung, stabile ECMP-Lastverteilung und – in vielen Netzen – das Underlay für MPLS oder Segment Routing. Ein gutes IGP Design minimiert Kontrollplan-Last und begrenzt die Ausbreitung von Änderungen.

  • Stabile Topologieverteilung: Änderungen müssen schnell, aber ohne Flapping und Kontrollplan-Stürme verteilt werden.
  • Vorhersehbare Pfadwahl: Konsistente Metriken und klare TE-/Policy-Leitplanken.
  • Skalierung: Viele Knoten und Links, ohne dass LSDB/State explodiert.
  • Fast Convergence: Wiederherstellung in definierten Grenzen (Zeit, Loss, Latenzsprung).
  • Unterstützung für MPLS/SR: IGP als zuverlässige Basis für Label-/SID-Verteilung und TE-Use-Cases.
  • Operationalisierung: Messbarkeit, Alarmkorrelation und klare Failure Domains.

Das wichtigste Ziel: Kontrollplan-Komplexität begrenzen

In großen Telco-Netzen sind „Kontrollplan-Überraschungen“ teuer. Ein IGP-Design ist dann gut, wenn es sich auch im Fehlerfall erklären lässt: Warum ist der Pfad gewechselt? Warum ist ECMP so verteilt? Warum gibt es eine Konvergenzwelle? Diese Fragen müssen ohne Spezialwissen beantwortbar sein.

OSPF und IS-IS: Gemeinsamkeiten und fundamentale Unterschiede

OSPF und IS-IS sind beide Link-State-Protokolle. Beide bauen eine Datenbank der Topologie auf und berechnen darauf basierend kürzeste Pfade. Beide unterstützen Hierarchie, ECMP und Erweiterungen. Die Unterschiede liegen weniger im „Können“, sondern im Modell: wie Hierarchie abgebildet wird, wie Erweiterungen integriert werden, welche Betriebsgewohnheiten sich etabliert haben und wie sich das Ganze in großen Domains anfühlt.

  • Link-State Prinzip: Beide verteilen Zustandsinformationen über Links/Knoten und rechnen SPF.
  • Hierarchiefähigkeit: OSPF mit Areas (Backbone-Area), IS-IS mit Levels (L1/L2).
  • ECMP: Beide unterstützen mehrere gleichwertige Pfade.
  • TE/SR-Erweiterungen: Beide können als Basis für Traffic Engineering und Segment Routing dienen.

Die wichtigste Differenz im Telco-Alltag: Domänenmodell und „Operational Feel“

OSPF wird häufig in Enterprise-Umgebungen eingesetzt und bringt ein sehr klares Area-Konzept mit. IS-IS ist historisch stark im Service-Provider-Backbone verankert und wird oft als besonders „backbone-freundlich“ wahrgenommen, weil das Level-Konzept sehr gut zur Core/Region-Struktur passt und Erweiterungen über TLVs flexibel integriert werden. Beide Wahrnehmungen sind nicht absolut, aber sie prägen Praxisentscheidungen.

Hierarchie: OSPF Areas vs. IS-IS Levels im Backbone

Hierarchie ist im Telco-Backbone entscheidend, um Skalierung und Stabilität zu erreichen. Sie bestimmt, wie viel Detail ein Knoten sehen muss und wie weit sich Änderungen ausbreiten. OSPF strukturiert über Areas, IS-IS über Level-1 und Level-2 (häufig: L2 im Core, L1 in regionalen Bereichen). Beide Modelle können ähnliche Zielbilder umsetzen, aber die Designentscheidungen fühlen sich unterschiedlich an.

  • OSPF: Area-Backbone-Konzept mit Area 0 als Kern. Nicht-Backbone-Areas hängen logisch am Backbone.
  • IS-IS: L2 bildet oft den Backbone, L1 die Regionen; L1/L2-Router verbinden Ebenen.
  • Gemeinsames Ziel: Detailänderungen regional halten, Core stabil halten, klare Übergänge schaffen.

Praktische Telco-Pattern

  • OSPF Pattern: Core als Area 0, Metro-Regionen als separate Areas; Summarization an ABRs, klare Area-Policies.
  • IS-IS Pattern: Backbone als Level-2 Domain, Regionen als L1; L1/L2-Gateways an Metro-Edges.

Summarization und Topologie: Warum IGP-Design und IP-Plan zusammengehören

Hierarchisches Routing funktioniert nur, wenn Adressierung aggregierbar ist. Summarization reduziert Routing-State und begrenzt Flaps, kann aber Blackholes verursachen, wenn sie nicht zur Topologie passt. In Telco-Netzen wird Summarization typischerweise an klaren Aggregationspunkten umgesetzt: Metro-Edges, Cluster-Gateways, PoP-Kanten. Das gilt unabhängig davon, ob OSPF oder IS-IS verwendet wird – aber die praktische Umsetzung und die „Gefühlssicherheit“ unterscheiden sich je nach Modell und Teamgewohnheit.

  • Adress-Hierarchie: Region → Cluster → Standort → Rolle erzeugt natürliche Summary-Blöcke.
  • Summary-Punkte: Übergänge zwischen Ebenen (Access/Metro/Core) sind natürliche Orte für Aggregation.
  • Blackhole-Vermeidung: Summaries nur dort, wo Detailreachability vollständig gegeben ist.
  • Störfalltests: Summaries müssen auch im Failover korrekt funktionieren.

Die Blueprints-Logik: Wenige Domänentypen, viele Wiederholungen

Ein IGP skaliert am besten, wenn es nur wenige Domain/Area/Level-Muster gibt, die überall gleich funktionieren. Jede Sonderarea, jede Sondermetric, jede Ausnahme erhöht den Zustandsraum und macht Konvergenz schwerer vorhersagbar.

Konvergenz und Stabilität: Timer, Erkennung und Flap-Kontrolle

Telco-Backbones brauchen schnelle Wiederherstellung, aber ohne Instabilität. Konvergenz besteht aus Erkennung (wie schnell wird ein Fehler erkannt), Verteilung (wie schnell wird die Änderung propagiert), SPF-Berechnung (wie schnell wird neu gerechnet) und Forwarding-Umschaltung (wie schnell wird tatsächlich umgeschaltet). OSPF und IS-IS können beide schnell konvergieren, aber das Design entscheidet, ob das in der Praxis stabil bleibt.

  • Fehlererkennung: Link-Down, optische Fehler, Health-Mechanismen; robuste Erkennung ist wichtiger als „aggressive Timer“.
  • SPF-Steuerung: SPF-Throttling/Hysterese verhindert Konvergenzstürme bei Flapping.
  • LSA/LSP-Flutkontrolle: Update-Stürme müssen beherrschbar bleiben, besonders in großen Domains.
  • Wartungsfähigkeit: Planned Maintenance soll planbare Pfadänderungen erzeugen, nicht chaotische Flaps.

Konvergenz messen statt raten

Carrier-Grade IGP-Design ist messbar: Zeit bis Pfadwechsel, Paketverlust während Umschaltung, Latenzsprung, Queue-Drops im Störfall. Ohne Telemetry bleibt Konvergenz eine Annahme, was in SLA- und Audit-Kontexten problematisch ist.

IGP als Basis für MPLS und Segment Routing: Was im Design zählt

In Telco-Backbones ist das IGP oft das Underlay für MPLS, SR-MPLS oder SRv6. Damit wird IGP-Design zu einem Topologie-Tool: Es bestimmt, wie Node-IDs/Loopbacks verteilt werden, wie ECMP-Pfade entstehen und wie zuverlässig Transportpfade bleiben. SR-Design braucht eine stabile IGP-Basis: konsistente Metriken, klare Domänengrenzen, stabile Flooding-Mechanik und eine saubere Adress-/ID-Strategie.

  • Loopbacks/Node-IDs: Konsistente, hierarchische Planung hilft bei SRGB/SID-Schemata und Troubleshooting.
  • ECMP-Planbarkeit: Gleichwertige Pfade sind im Core normal; Hashing und Pfadkosten müssen stabil sein.
  • TE-Informationen: Wenn TE genutzt wird, müssen Linkattribute konsistent gepflegt werden.
  • Domänenintegration: Multi-Domain-Designs brauchen klare Border-Patterns, egal ob OSPF oder IS-IS.

Ein häufiges Missverständnis: „IGP ist nur Underlay“

IGP ist die Grundlage für Pfadwahl, und damit indirekt für Servicequalität. Wenn Metrikmodelle schlecht sind oder Domänengrenzen unklar, wird TE/SR kompliziert, und Betrieb wird teuer. Ein gutes IGP-Design ist daher ein Service-Enabler.

Operationalisierung: Troubleshooting, Telemetry und Teamkompetenz

Ein „Expertenvergleich“ ist ohne Betriebsperspektive unvollständig. Die beste Protokollwahl ist die, die Ihr Team sicher betreiben kann – mit klaren Runbooks, konsistenten Konfigurations-Templates, guter Observability und einem Ausnahmeprozess, der Varianten begrenzt. In der Praxis sind Skillsets, Tooling und bestehende Betriebsmodelle häufig entscheidender als einzelne Featureunterschiede.

  • Standard-Templates: Einheitliche Rollenmodelle (Core-P, Core-Edge, Metro-Edge) reduzieren Varianten.
  • Telemetry: Adjacency-Status, SPF-Events, Update-Raten, CPU/Memory und Path-Change-Events.
  • Alarmkorrelation: Failure Domains abbilden (Trasse/PoP/Link) statt Alarmflut pro Router.
  • Change-Governance: Versionierung, Reviews, Wellen-Rollouts, Rollback.

Evidence-by-Design: IGP als auditierbarer Baustein

Wenn Sie Changes, Konvergenzzeiten und Pfadwechsel systematisch erfassen, wird IGP-Betrieb auditierbar. Das ist zunehmend wichtig: Kunden, interne Security-Teams und Regulierung erwarten nachvollziehbare Nachweise – nicht nur „es hat funktioniert“.

OSPF im Telco-Backbone: Stärken und typische Einsatzmuster

OSPF ist weit verbreitet, gut dokumentiert und in vielen Toolchains hervorragend unterstützt. In Telco-Backbones wird OSPF häufig dann gewählt, wenn bereits viel OSPF-Kompetenz existiert, wenn Area-Modelle sauber in die Topologie passen oder wenn Migration aus Enterprise-/Regionalnetzen vereinfacht werden soll.

  • Stärken: Breite Verfügbarkeit, bekannte Betriebsmodelle, klares Area-Konzept.
  • Typische Pattern: Core als Area 0, Regionen als Areas; Summarization an ABRs; klare Policy-Regeln pro Area.
  • Wichtige Disziplin: Area-Design konsistent halten, Sonderareas vermeiden, Summaries topologisch korrekt setzen.

OSPF-Falle: Area-Wildwuchs

Wenn OSPF-Areas ohne klare Topologie-Logik entstehen, steigt Komplexität: Sonderfälle bei Inter-Area-Routing, schwer erklärbare Pfade und höhere Change-Risiken. Ein sauberer Blueprint begrenzt die Zahl der Area-Typen und standardisiert Übergänge.

IS-IS im Telco-Backbone: Stärken und typische Einsatzmuster

IS-IS ist im Service-Provider-Bereich traditionell stark und wird häufig für große Backbones gewählt. In vielen Telco-Designs passt das Level-Modell gut zur Hierarchie: L2 als Backbone, L1 als regionale Domänen. Erweiterungen über TLVs gelten in der Praxis als flexibel und „backbone-freundlich“, insbesondere wenn SR/TE-Use-Cases ausgebaut werden.

  • Stärken: Sehr gutes Hierarchiemodell für Core/Region, häufig als skalierungsfreundlich wahrgenommen.
  • Typische Pattern: L2 im Backbone, Regionen als L1, L1/L2-Gateways an Metro-Edges.
  • Wichtige Disziplin: Level-Grenzen sauber halten, konsistente Metriken und klare Summaries.

IS-IS-Falle: „Alles L2“ ohne Struktur

IS-IS kann als flache L2-Domäne betrieben werden, aber in großen Netzen verliert man dann Hierarchie-Vorteile. Carrier-Grade IS-IS-Design nutzt Levels, um Änderungen zu lokalisieren und Kontrollplan-Last zu begrenzen.

Entscheidungskriterien: Wie Sie zwischen OSPF und IS-IS wählen

Für Telco-Backbones ist die Wahl am besten, wenn sie aus Anforderungen und Betriebsfähigkeit abgeleitet wird. Beide Protokolle können funktionieren – entscheidend ist, wie gut das Domänenmodell zu Ihrer Topologie und Governance passt.

  • Topologie-Fit: Passt das Area-/Level-Modell natürlich zu Ihrer Core/Metro/Region-Struktur?
  • Skalierungsplan: Wie viele Regionen, wie viele Knoten, wie viel Wachstum in 3–5 Jahren?
  • SR/TE-Roadmap: Welche SR- und TE-Use-Cases sind geplant, und wie reif ist Observability?
  • Teamkompetenz: Welche Skills, Runbooks und Toolchains sind vorhanden?
  • Migration: Wie groß ist der Migrationsaufwand, und wie lange muss Koexistenz funktionieren?
  • Governance: Können Sie Varianten und Ausnahmen konsequent begrenzen?

Ein pragmatisches Ergebnis: Das Protokoll ist selten der Engpass

In der Praxis scheitern IGP-Projekte häufiger an inkonsistenter Topologie, schlechtem IP-Plan, fehlender Telemetry und zu vielen Ausnahmen als am Protokoll selbst. Wenn Sie Rollenmodelle, Summarization-Blueprints, Konvergenztests und Governance sauber etablieren, können sowohl OSPF als auch IS-IS ein sehr stabiles Telco-Backbone tragen.

Praktische Leitlinien für ein carrier-grade IGP Design

  • Hierarchie erzwingen: Areas/Levels als Spiegel der Topologie, nicht als historischer Zufall.
  • Metriken standardisieren: Konsistentes Metrikmodell, keine „kreativen“ Ausnahmen ohne Testplan.
  • Summarization topologisch korrekt: Summaries an natürlichen Aggregationskanten, Blackholes aktiv verhindern.
  • Konvergenz messen: Pfadwechsel, Loss und Latenzsprünge als Standard-KPIs.
  • Failure Domains sichtbar machen: Alarmkorrelation nach Trasse/PoP/Region statt Alarmflut pro Router.
  • Templates und Policy-as-Code: Versionierung, Reviews, Wellen-Rollouts, Rollback.
  • SR/TE nur auf stabilem Underlay: Erst IGP stabilisieren, dann SR/TE skalieren.

Related Articles