Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

10. Juni 202610. Juni 2026
AI Models, Google

DiffusionGemma denoisiiert bis zu 256 Token parallel pro Schritt statt einzeln und erreicht auf NVIDIA H100 1.000 Token/Sekunde bei Batch-Size 1 — ohne Cloud-Abhängigkeit.

Share on:

Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

Lumi AI News

Rechtliches

Themenbereiche