EfficientRollout: Selbstspekulative Dekodierung für schnellere RL-Rollouts18. Juni 20264. Juli 2026AI ModelsEfficientRollout nutzt selbstspekulative Dekodierung mit adaptiver Systemauslastung, um Rollout-Latenz in RL-Szenarien zu senken, ohne separate Drafter-Pretraining oder das Zielmodell zu gefährden. Share on: