Site icon bintorosoft.com

QoS-Topologie: Wo Marking/Queuing/Policing in Telco-Designs hingehört

QoS-Topologie entscheidet im Telco- und Provider-Umfeld darüber, ob Servicequalität planbar und SLA-fähig ist oder ob QoS zu einem unübersichtlichen Sammelsurium aus lokalen „Best Effort“-Tweaks wird. Quality of Service ist dabei nicht nur eine Gerätekonfiguration, sondern ein Architekturthema: WoWoWo

QoS im Provider-Netz: Drei Bausteine, drei unterschiedliche Aufgaben

QoS wird im Alltag oft als „Priorisierung“ zusammengefasst. In der Praxis sind es drei getrennte Aufgaben, die bewusst auf verschiedene Stellen im Netz verteilt werden sollten. Wenn man diese Aufgaben vermischt, entstehen Inkonsistenzen und schwer erklärbare Fehlerbilder.

Merksatz: Marking ist Identität, Queuing ist Verhalten, Policing ist Vertrag

Marking sagt, was der Traffic „ist“, Queuing entscheidet, wie das Netz bei Engpässen reagiert, und Policing/Shaping setzt Grenzen durch, die oft direkt aus Produkten und SLAs abgeleitet sind.

Warum QoS topologisch geplant werden muss

Telco-Netze sind hierarchisch. Ein Traffic-Flow läuft vom Customer Edge durch Access, Aggregation, Metro, Core und wieder hinaus. Engpässe können überall entstehen: im Access-Uplink, im Metro-Ring, im Core während N-1-Failover, im DCI, oder an Peering-Edges. Ein QoS-Design ist nur dann wirksam, wenn es diese Topologie berücksichtigt und die richtigen Funktionen an die richtigen Stellen setzt.

Ein Carrier-Grade Ziel: End-to-end gleiches Klassenmodell

Die wichtigste Voraussetzung für stabile QoS ist ein einheitliches Klassenmodell: wenige Serviceklassen, die überall dieselbe Bedeutung haben, und rollenbasierte Policies, die diese Klassen in jeder Netzebene konsistent behandeln.

Marking: Wo Kennzeichnung hingehört und warum „Trust“ ein Designentscheid ist

Marking sollte möglichst früh passieren – idealerweise am Eintrittspunkt in das Provider-Netz (Ingress). Denn dort ist Kontext vorhanden: Kunde, Serviceprofil, SLA, Porttyp, ggf. VLAN/VRF. Gleichzeitig ist Marking ein Sicherheits- und Vertragsproblem: Darf ein Kunde überhaupt eigene Markierungen setzen? Oder wird alles auf Provider-Standards umgemappt?

Warum zu spätes Marking teuer ist

Wenn Marking erst im Core passiert, hat der Core keine Servicekontexte mehr und muss anhand grober Kriterien raten. Das führt zu Ausnahmen, Sonderregeln und schlechter Skalierung. Marking gehört dahin, wo Serviceidentität bekannt ist: an die Edge.

Queuing: Wo Priorisierung wirklich wirkt

Queuing ist dort wichtig, wo Engpässe auftreten. In Telco-Netzen sind das häufig Uplinks in Access/Metro, DCI-Links, Peering-Edges und Störfallpfade im Core. Ein häufiger Fehler ist, Queuing nur an einer Stelle „schön“ zu konfigurieren und anzunehmen, dass es end-to-end wirkt. In Wahrheit braucht jede Engpassstelle ein konsistentes Queue- und Scheduling-Modell.

Priority Queues: Nur mit klaren Guardrails

Strict Priority kann für Echtzeitverkehr sinnvoll sein, ist aber gefährlich ohne Begrenzung: Wenn zu viel Traffic in die höchste Klasse gerät (absichtlich oder durch Fehlmarking), verhungern andere Klassen. Carrier-Grade Designs kombinieren Priority daher mit klaren Limits und einem konservativen Klassenmodell.

Policing vs. Shaping: Wo harte Grenzen sinnvoll sind (und wo nicht)

Policing verwirft oder markiert Pakete, wenn ein Rate-Limit überschritten wird. Shaping glättet Traffic und puffert kurzzeitig, um Burst-Verhalten zu kontrollieren. In Telco-Designs ist die Platzierung entscheidend: Policing im falschen Segment kann latenzkritische Flows zerstören, Shaping am falschen Ort kann unnötig Latenz erhöhen.

Designregel: Verträge am Rand, Fairness im Netz

Harte Vertragsgrenzen (Policing) gehören an die Service-Edge, wo der Vertrag bekannt ist. Im Kern sollten Sie mit Queueing/Scheduling arbeiten, um Fairness und Priorisierung umzusetzen, ohne willkürlich Pakete zu verwerfen.

QoS-Klassenmodell: Wenige Klassen, klare Semantik, end-to-end konsistent

Ein häufiges Skalierungsproblem ist ein überkomplexes Klassenmodell: zu viele DSCP-Werte, zu viele Sonderklassen pro Service, zu viele Ausnahmen. Das wird schnell unbetriebsfähig, weil jedes Gerät, jede Domäne und jeder Partner das Modell exakt gleich umsetzen müsste. Erfolgreiche Telco-Designs arbeiten mit wenigen, klar definierten Klassen.

LSI-Praxisbezug: QoS-Blueprint statt DSCP-Wildwuchs

Ein QoS-Blueprint definiert für jede Klasse: erlaubte Markings am Ingress, Queue-Parameter an Engpässen, Policing/Shaping-Regeln, Telemetry-KPIs und Abnahmetests. So wird QoS wiederholbar und auditierbar.

QoS in typischen Telco-Topologien: Core, Metro, Access und DC

Die richtige Platzierung von Marking/Queuing/Policing hängt von der Topologieebene ab. Die folgenden Muster sind in Provider-Netzen besonders verbreitet, weil sie Betrieb und Skalierung unterstützen.

Access-Topologie: Kundennähe und harte Vertragsgrenzen

Metro/Aggregation: Shared Links, viele Kunden, hoher Mix

Core/Backbone: Hohe Kapazität, Störfallpfade und Schutzklassen

DC/DCI: Microbursts, Overlays und hohe Ost-West-Last

QoS und Störfallbetrieb: N-1, FRR/TI-LFA und ECMP-Remapping

Ein QoS-Design, das nur im Normalbetrieb funktioniert, ist im Provider-Alltag unzureichend. In Störfällen ändern sich Pfade, ECMP-Sets schrumpfen, Traffic wird remapped, und Schutzpfade können durch andere Engpässe laufen. Genau dann muss QoS die kritischen Klassen stabil halten und Degradation kontrollieren.

Ein einfaches Störfallprinzip

SLA_Stabilität≈Headroom+Priorisierung+Scope

Headroom verhindert Überlast, Priorisierung schützt kritische Klassen, und Scope verhindert, dass zu viel Traffic in hohe Klassen „hineinmarkiert“ wird.

Observability: QoS ohne Queue-Telemetry ist Blindflug

In Telco-Netzen sind QoS-Probleme häufig kurzzeitig: Microbursts, kurze Overloads im Failover, einzelne Member-Hotspots in LAGs. Durchschnittswerte verschleiern das. Ein QoS-Blueprint muss daher Telemetry fest verankern: Queue-Drops pro Klasse, Queue-Tiefe, Member-Link-Drops, Latenz- und Loss-KPIs pro Serviceklasse.

Evidence-by-Design: QoS wird auditierbar durch Messdaten

Wenn Sie QoS-Profile versionieren, Abnahmetests standardisieren und Queue-Telemetry historisieren, können Sie Servicequalität nachweisen. Das reduziert Diskussionen mit Kunden und intern – und es macht QoS-Änderungen sicherer, weil Auswirkungen messbar sind.

Typische Fallstricke und wie man sie vermeidet

Praktische Leitlinien: Wo Marking/Queuing/Policing hingehört

Exit mobile version