Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs10. Juni 202610. Juni 2026AI Models, GoogleShare on:DiffusionGemma denoisiiert bis zu 256 Token parallel pro Schritt statt einzeln und erreicht auf NVIDIA H100 1.000 Token/Sekunde bei Batch-Size 1 — ohne Cloud-Abhängigkeit. Share on: