AWS demonstriert eine Observability-Lösung für LLM-Inferenz auf SageMaker, die Infrastruktur-Metriken (Latenz, GPU-Auslastung, Fehlerquoten) und Qualitätsmetriken (Genauigkeit, Konsistenz) über Amazon CloudWatch und Managed Grafana korreliert und gemeinsam optimiert.