NEUSEVRA: Selektive Verifikation für effizientere KI-Reasoning bei Inferenzzeit19. Juni 202619. Juni 2026AI ModelsShare on:SEVRA spart beim Inferenzen durch selektive Verifikation 26–91 Prozent Tokens ein, ohne die Genauigkeit zu beeinträchtigen, stellt aber längere initiale Lösungsversuche als teilweise kostengünstiger dar. Share on: