Zum Inhalt springen

Gemma 4 Modelle ab sofort auf Amazon Bedrock verfügbar

Share on:

Auf den Punkt: Gemma 4 Familie mit drei Varianten (31B dense, 26B-A4B MoE, E2B compact) steht als vollständig verwalteter Service auf Amazon Bedrock zur Verfügung, mit nativem Reasoning, Function Calling und Multimodal-Support.

Google DeepMind hat die Gemma-4-Modellfamilie auf Amazon Bedrock verfügbar gemacht. Die drei Open-Weight-Varianten bieten unterschiedliche Größen und Architekturen für verschiedene Anforderungsprofile, von 2,3 Milliarden effektiven Parametern bis zu 30,7 Milliarden Parametern.

Die Gemma-4-Familie von Google DeepMind ist nun über Amazon Bedrock bereitgestellt. Sie umfasst drei instruction-tuned Varianten: Gemma 4 31B (30,7 Milliarden Parameter, dense Architektur), Gemma 4 26B-A4B (25,2 Milliarden Parameter insgesamt, 3,8 Milliarden aktiv, Mixture-of-Experts-Architektur) und Gemma 4 E2B (5,1 Milliarden Parameter insgesamt, 2,3 Milliarden effektiv, dense Architektur mit Progressive Layer Exchange). Alle Varianten unterstützen Text- und Bild-Input, natively Funktion Calling für agentenbasierte Workflows sowie einen built-in Reasoning-Mode. Die Modelle sind unter der Apache-2.0-Lizenz verfügbar.

Unabhängige Benchmarks zeigen die Fokussierung auf Intelligence-per-Parameter: Artificial Analysis meldet für Gemma 4 31B einen Intelligence Index von 39, deutlich über dem Median von 15 in der Gewichtsklasse 4B–40B für Open-Weight-Modelle. Die Context Window variieren zwischen 128K Tokens (E2B) und 256K Tokens (31B und 26B-A4B). Alle Varianten sind in Standard-, Priority- und Flex-Service-Tiers verfügbar.

Als vollständig verwalteter Service auf Amazon Bedrock läuft die Inferenz ausschließlich auf AWS-Infrastruktur, ohne dass Sie Modellgewichte hosten oder Inference-Stacks betreiben müssen. Das ist relevant für CTOs, die offene Modelle produktiv einsetzen wollen, ohne Data-Protection-, Compliance- oder Kontrollanforderungen zu kompromittieren. Ihre Prompts und Completions werden nicht zum Trainieren von Modellen verwendet und nicht an Dritte weitergegeben.

Die Modelle unterstützen über 35 Sprachen out-of-the-box, mit Pre-Training über 140 Sprachen. Da die Modelle Open-Weight sind, können Sie die Architektur und Trainingsmethodik unabhängig evaluieren, auf eigenen Workloads benchmarken und bei Bedarf Fine-Tuning auf proprietären Daten durchführen. Nutzungsfälle sind multimodale Agenten, Lightweight-Anwendungen, Dokumentenverständnis-Pipelines und Software-Engineering-Workflows.


Quelle: aws.amazon.com · Erschienen 15. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.1.

Share on: