Im Netzwerkdesign wird oft das Ziel verfolgt, ein „hitless failover“ zu erreichen, also einen Ausfall ohne wahrnehmbare Unterbrechung der Dienste. Dies ist besonders in kritischen Infrastrukturen wie in Rechenzentren oder Campusnetzwerken von Bedeutung. Dabei wird ein Übergang von einem ausgefallenen System auf ein funktionierendes System ohne Ausfallzeit oder signifikante Latenz erreicht. Doch wie misst man tatsächlich die Downtime im LAN, und wie stellt man sicher, dass das Failover „hitless“ ist? In diesem Artikel werden Methoden zur Messung und Analyse von Failover-Ereignissen sowie typische Fehlerquellen behandelt.
1. Grundlagen des Hitless Failovers
Ein hitless failover beschreibt einen Failover-Mechanismus, bei dem ein Fehler oder eine Störung in einem Netzwerkgerät oder einer Verbindung passiert, ohne dass es zu einer merklichen Unterbrechung der Verbindung oder der Dienste kommt. Dies ist besonders wichtig für Anwendungen, bei denen eine kontinuierliche Verfügbarkeit erforderlich ist.
1.1. Failover-Szenarien
- Redundante Verbindungen oder Geräte übernehmen automatisch die Last, wenn der primäre Pfad ausfällt.
- Die Übergabe erfolgt innerhalb von Millisekunden, ohne dass Endbenutzer eine Unterbrechung bemerken.
1.2. Voraussetzungen für Hitless Failover
- Optimierte Netzwerkgeräte mit schnellem Failover-Mechanismus (z.B. Spanning Tree Protocol, HSRP, VRRP, vPC).
- Richtige Konfiguration von Routing- und Switching-Protokollen, um einen reibungslosen Übergang zu gewährleisten.
2. Messmethoden für Downtime im LAN
Um zu überprüfen, ob das Failover wirklich ohne Ausfallzeit funktioniert, müssen verschiedene Messmethoden und Metriken herangezogen werden. Die wichtigsten Methoden zur Messung der Downtime beinhalten Monitoring-Tools, Protokollanalysen und Netzwerk-Traffic-Überwachung.
2.1. Monitoring-Tools und SNMP
- Ein System zur Netzwerküberwachung wie PRTG, Zabbix oder SolarWinds kann verwendet werden, um Ausfälle und Failover-Ereignisse zu erkennen.
- Die SNMP-Überwachung von Geräten hilft dabei, die Verfügbarkeit und Performance von Geräten in Echtzeit zu überwachen.
PRTG: SNMP Polling Setup für Router/Switches
2.2. Protokollierung und Event-Logs
- Durchsuchen Sie die Event-Logs der beteiligten Netzwerkgeräte (Switches, Router, Firewalls) nach Failover-Ereignissen.
- Ein Beispielbefehl zum Prüfen des Event-Logs auf Cisco-Switches:
Switch# show logging
2.3. Netzwerk-Traffic-Überwachung
- Mit Tools wie Wireshark können Sie den Netzwerk-Traffic überwachen, um festzustellen, ob der Traffic ordnungsgemäß auf den redundanten Pfad umgeleitet wird.
- Sie können auch die Dauer des Failovers messen, indem Sie den Zeitpunkt des Verlusts des Primärpfades und den Moment der Wiederherstellung mit einem Zeitstempel aufzeichnen.
Wireshark: Filter für STP-Protokoll und HSRP/VRRP
3. Praktische Methoden zur Sicherstellung von Hitless Failover
Es gibt mehrere Strategien und Techniken, die verwendet werden können, um die Ausfallzeit zu minimieren und ein nahezu „hitless“ Failover zu erreichen. Dazu gehört die richtige Konfiguration von Protokollen, das richtige Design der redundanten Verbindungen und das Testen unter realen Bedingungen.
3.1. Einsatz von BFD (Bidirectional Forwarding Detection)
- BFD ermöglicht es, eine schnelle Fehlererkennung im Netzwerk zu implementieren, um Ausfälle sofort zu erkennen und das Failover schnell zu initiieren.
- BFD stellt sicher, dass beim Ausfall eines Pfades eine andere Verbindung mit minimaler Verzögerung übernommen wird.
Router# router ospf 1
Router(config-router)# bfd all-interfaces
3.2. Redundante Verbindungen und LACP
- Verwenden Sie Link Aggregation Control Protocol (LACP) oder Port-Channels, um mehrere physische Verbindungen zu einem logischen Link zu bündeln, der im Falle eines Ausfalls eine hohe Verfügbarkeit bietet.
- Die Konfiguration eines LACP-basierten Port-Channels reduziert die Wahrscheinlichkeit eines Failovers auf einem einzelnen Pfad und ermöglicht eine schnellere Umleitung des Traffics.
Switch(config)# interface range GigabitEthernet 1/0/1 - 2
Switch(config-if-range)# channel-group 1 mode active
3.3. STP Fast Convergence und Rapid-PVST+
- Verwenden Sie „Fast Convergence“ mit STP, um die Zeit bis zur Netzwerkrückkehr nach einem Failover zu minimieren.
- Mit Rapid-PVST+ können Sie die Konvergenzzeit der Spanning-Tree-Protokolle erheblich verringern und somit das Netzwerk schnell wieder betriebsbereit machen.
Switch(config)# spanning-tree mode rapid-pvst
4. Fazit: Effektive Failover-Messung und -Optimierung
Die Sicherstellung eines „hitless“ Failovers erfordert eine sorgfältige Planung, die Auswahl geeigneter Protokolle und Mechanismen wie BFD, LACP und STP sowie eine präzise Messung und Überwachung der Netzwerkperformance. Indem Sie die richtigen Tools und Konfigurationen implementieren, können Sie Ausfallzeiten minimieren und das Netzwerk in einer stabilen und hochverfügbaren Umgebung betreiben.
Konfiguriere Cisco Router & Switches und liefere ein Packet-Tracer-Lab (CCNA)
Hallo! Ich bin ein CCNA-Network Engineer und unterstütze Sie bei Cisco Router- und Switch-Konfigurationen – inklusive eines vollständigen Cisco Packet-Tracer-Labs (.pkt). Ideal für Lern-/Übungsszenarien, Validierung oder eine saubere Demo-Topologie.
Was ich (je nach Paket) umsetze
-
Switching: VLANs, Trunking (802.1Q), Port-Zuweisung, STP-Basics (PortFast/BPDU Guard wo sinnvoll)
-
Routing: Default/Static Routing oder OSPF, Inter-VLAN Routing (Router-on-a-Stick)
-
Services: DHCP (Pools/Scopes), NAT/PAT für Internet-Simulation
-
Optional Security: Basic ACLs und SSH-Hardening
-
Test & Verifikation: Ping/Traceroute + wichtige Show-Commands (mit erwarteten Ergebnissen)
Sie erhalten
-
✅ Packet Tracer .pkt Datei
-
✅ Saubere Konfigurations-Notizen pro Gerät
-
✅ Verifikations-Checkliste + erwartete Outputs
-
✅ Kurze Dokumentation (wie die Topologie funktioniert)
Bitte schreiben Sie mir vor der Bestellung, damit wir Scope, Packet-Tracer-Version, Geräteanzahl und Deadline klären.
Konfiguriere Cisco Router & Switches | Cisco Packet-Tracer-Labs. Finden Sie mich auf Fiverr.












