March 8, 2026

Observability in Compose: Metrics, Logs und Traces konsistent integrieren

Observability ist ein zentraler Aspekt moderner Microservice-Architekturen. In Docker Compose-Umgebungen ermöglicht sie, Metriken, Logs und Traces konsistent zu sammeln, zu visualisieren und zu korrelieren. Ein durchdachtes Observability-Setup verbessert die Fehlerdiagnose, Performance-Optimierung und die langfristige Wartbarkeit von Services.

Table of Contents

1. Grundlagen der Observability

Observability beschreibt die Fähigkeit, den Zustand eines Systems anhand von externen Signalen zu verstehen. In Compose-Stacks lassen sich drei Kernbereiche unterscheiden:

Metrics: Quantitative Messwerte wie CPU-Auslastung, Speichernutzung, Request-Raten.
Logs: Ereignisse und Nachrichten von Applikationen und Containern.
Traces: Verfolgbarkeit von Requests über mehrere Services hinweg (Distributed Tracing).

2. Metriken erfassen

Metriken helfen, die Performance einzelner Container und Services zu überwachen. Docker Compose erlaubt die Integration von Tools wie Prometheus oder cAdvisor.

Prometheus Integration

services:
  prometheus:
    image: prom/prometheus:latest
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"
  app:
    image: myapp:latest
    ports:
      - "8080:8080"
    labels:
      - "prometheus.scrape=true"
      - "prometheus.port=8080"

Prometheus sammelt Metriken von Container-Endpunkten.
Labels ermöglichen selektives Scraping einzelner Services.
cAdvisor kann Container-Resourcen wie CPU, RAM oder Netzwerkstatistiken liefern.

3. Logs konsolidieren

Logs sind essenziell, um Fehler und Abläufe nachzuvollziehen. Compose erlaubt zentrale Log-Treiber und Forwarding zu externen Systemen.

JSON-File und lokales Logrotate

services:
  app:
    image: myapp:latest
    logging:
      driver: "json-file"
      options:
        max-size: "10m"
        max-file: "3"

Loki für zentrale Log-Erfassung

services:
  loki:
    image: grafana/loki:2.8.2
    ports:
      - "3100:3100"
  promtail:
    image: grafana/promtail:2.8.2
    volumes:
      - /var/log:/var/log
      - ./promtail-config.yaml:/etc/promtail/config.yaml

Promtail liest Logs aus Containern oder Hostpfaden.
Loki speichert Logs zentral und ermöglicht Abfragen über Grafana.
Trennung von Logs pro Service erleichtert Fehlersuche.

4. Distributed Tracing einbinden

Tracing erlaubt, Requests über mehrere Services hinweg zu verfolgen, um Latenzen und Bottlenecks zu erkennen.

OpenTelemetry Collector Setup

services:
  otel-collector:
    image: otel/opentelemetry-collector:latest
    volumes:
      - ./otel-config.yaml:/etc/otel/config.yaml
    ports:
      - "4317:4317" # gRPC Receiver
      - "55681:55681" # HTTP Receiver
  app:
    image: myapp:latest
    environment:
      OTEL_EXPORTER_OTLP_ENDPOINT: "otel-collector:4317"

Collector empfängt Traces von Services und leitet sie weiter an Backends wie Jaeger oder Tempo.
Instrumentierung der Anwendung mit OpenTelemetry SDK ist notwendig.
Tracing ergänzt Metriken und Logs für vollständige Observability.

5. Dashboards und Visualisierung

Grafana ist das zentrale Tool, um Metriken, Logs und Traces visuell zu konsolidieren:

services:
  grafana:
    image: grafana/grafana:latest
    ports:
      - "3000:3000"
    volumes:
      - grafana-data:/var/lib/grafana

Dashboards kombinieren Prometheus-Metriken, Loki-Logs und Traces.
Alerts können basierend auf Schwellenwerten definiert werden.
Visualisierung erleichtert Fehlerdiagnose und Kapazitätsplanung.

6. Best Practices für Observability in Compose

Alle Services mit konsistentem Logging-Format betreiben.
Metriken standardisiert exportieren und regelmäßig scrapen.
Traces zentral sammeln, um Request-Flows zu analysieren.
Monitoring-Tools als eigene Services im Compose-Stack betreiben.
Separate Netzwerke für Observability-Komponenten einsetzen, z.B. Prometheus, Loki, Grafana.
Environment-spezifische Konfigurationen über Overrides verwalten.
Automatisierte Backups und Retention-Policies für Logs und Metriken einplanen.

7. Troubleshooting von Observability-Komponenten

Praktische CLI-Befehle helfen, Probleme schnell zu erkennen:

# Prüfen, ob Container laufen docker-compose ps Logs eines Services ansehen docker-compose logs -f app Prometheus Targets prüfen curl http://localhost:9090/targets Testen, ob OTEL Collector erreichbar ist

docker exec -it app curl otel-collector:4317

Fehler in Metriken oder Logs oft auf falsche Netzwerkzuweisung oder Port-Mapping zurückzuführen.
Trace-Daten prüfen, ob Exporter korrekt konfiguriert sind.
Netzwerk-Isolation beachten: Observability-Services sollten erreichbar sein, aber nicht öffentlich exponiert.

Ein durchdachtes Observability-Konzept in Docker Compose sorgt dafür, dass Microservices messbar, nachvollziehbar und zuverlässig überwacht werden. Metriken, Logs und Traces bilden zusammen die Grundlage für schnelle Fehlerdiagnose, Performance-Optimierung und eine stabile Produktion.

Konfiguriere Cisco Router & Switches und liefere ein Packet-Tracer-Lab/GNS3

Ich biete professionelle Unterstützung im Bereich Netzwerkkonfiguration und Network Automation für private Anforderungen, Studienprojekte, Lernlabore, kleine Unternehmen sowie technische Projekte. Ich unterstütze Sie bei der Konfiguration von Routern und Switches, der Erstellung praxisnaher Topologien in Cisco Packet Tracer, dem Aufbau und Troubleshooting von GNS3- und EVE-NG-Labs sowie bei der Automatisierung von Netzwerkaufgaben mit Netmiko, Paramiko, NAPALM und Ansible. Kontaktieren Sie mich jetzt – klicken Sie hier.

Meine Leistungen umfassen:

Professionelle Konfiguration von Routern und Switches
Einrichtung von VLANs, Trunks, Routing, DHCP, NAT, ACLs und weiteren Netzwerkfunktionen
Erstellung von Topologien und Simulationen in Cisco Packet Tracer
Aufbau, Analyse und Fehlerbehebung von Netzwerk-Labs in GNS3 und EVE-NG
Automatisierung von Netzwerkkonfigurationen mit Python, Netmiko, Paramiko, NAPALM und Ansible
Erstellung von Skripten für wiederkehrende Netzwerkaufgaben
Dokumentation der Konfigurationen und Bereitstellung nachvollziehbarer Lösungswege
Konfigurations-Backups, Optimierung bestehender Setups und technisches Troubleshooting

Benötigen Sie Unterstützung bei Ihrem Netzwerkprojekt, Ihrer Simulation oder Ihrer Network-Automation-Lösung? Kontaktieren Sie mich jetzt – klicken Sie hier.