iLLaDA: 8B-Sprachmodell mit bidirektionaler Diffusion trainiert25. Juni 202626. Juni 2026AI ModelsiLLaDA zeigt, dass vollständig bidirektionales Diffusions-Training von Grund auf ein konkurrenzkräftiger Weg zu starken Sprachmodellen sein kann, auch ohne autoregressives Training. Share on: