Zum Inhalt springen

Amazon Bedrock Model Profiler: Open-Source-Tool für Modellauswahl

Auf den Punkt: Das Model Profiler aggregiert Modellmetadaten aus sieben Datenquellen in einer einzigen Weboberfläche mit Filterung, Vergleich und Verfügbarkeitskarten, um die Modellauswahl für CTOs zu beschleunigen.

AWS veröffentlicht das Model Profiler als Open-Source-Tool, um die Auswahl von Foundational Models in Amazon Bedrock zu vereinfachen. Die Lösung zentralisiert Metadaten von über 100 Modellen verschiedener Provider in einer durchsuchbaren Oberfläche.

Das Model Profiler ist eine Webanwendung, die den Zugriff auf mehr als 100 Foundational Models von Anbietern wie Anthropic, OpenAI, Meta, Mistral AI, Cohere und Amazon zentralisiert. Bislang mussten Entscheidungsträger Modellspezifikationen, Pricing-Informationen, regionale Verfügbarkeit und Kontextfenstergröße über mehrere AWS-Konsolen-Seiten, Dokumentationen und APIs hinweg recherchieren. Das Tool aggregiert diese Daten aus sieben Quellen: fünf AWS-APIs (ListFoundationModels, Price List, Service Quotas, ListInferenceProfiles und Mantle) sowie zwei öffentliche Datenquellen (LiteLLM Model Database und AWS-Dokumentation).

Für CTOs ist besonders die Abbildung von Performance-Metriken relevant: Tokens-per-Minute (TPM) definiert den Durchsatzobergrenze – etwa 1.000 Token entsprechen rund 750 Wörtern Text. Requests-per-Minute (RPM) limitieren unabhängig davon die Anzahl der API-Aufrufe. Das Tool zeigt diese Quoten pro Modell und Region an und ermöglicht direkte Kostenvergleiche zwischen On-Demand-, Batch- und Reserved-Tier-Preisen über 33 AWS-Regionen. Zusätzlich werden Modellstatus (aktiv, legacy, End-of-Life) aus der AWS-Dokumentation abgebildet.

Die Datenerfassung läuft vollautomatisiert über AWS Step Functions mit 17 Lambda-Funktionen. Eine agentic-System powered by Amazon Bedrock erkennt Datenlücken und wendet selbstheilend korrektive Konfigurationen an. Durch S3-basiertes Caching zwischen Lambda-Funktionen reduziert sich die Anzahl der API-Aufrufe von etwa 480 auf 29 pro Durchlauf (97% Cache-Hit-Rate). Die gesamte Pipeline benötigt 8–12 Minuten und läuft täglich, um Pricing- und Verfügbarkeitsdaten aktuell zu halten. Die Lösung ist als Open Source verfügbar und kann in unter fünf Minuten deployed werden.


Quelle: aws.amazon.com · Erschienen 1. Juli 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.

Share on: