Interface-Telemetrie: Alarme bauen, die nicht nerven, aber nützen
Interface-Telemetrie ist im NOC und im On-Call-Alltag eine der wichtigsten Datenquellen: Link-Status, Error-Counter, Drops, Auslastung, Optik-Werte, Queue-Statistiken und Events zeigen oft früher als Applikationsmetriken, dass etwas „kippt“. Trotzdem sind Interface-Alarme berüchtigt, weil sie entweder zu spät kommen („Link down“ ist schon die Katastrophe) oder viel zu früh und zu laut („CRC +1“ alle 30 Sekunden).…








