Transformer-Variante mit separaten State- und Prediction-Streams zeigt Effizienzgewinne2. Juli 20262. Juli 2026AI ModelsEin modifizierter Transformer mit zwei unabhängigen Computation-Streams für Zustandsverwaltung und Token-Vorhersage reduziert die notwendigen Ressourcen und verbessert die Performance um 2–3 Prozentpunkte bei Downstream-Tasks. Share on: