NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen

24. Juni 20264. Juli 2026
AI Models

KI-Agenten übertreffen Baseline auf nur knapp 18 Prozent echter wissenschaftlicher Aufgaben, weil sie Probleme eher neu rahmen als wirklich innovativ lösen.

Share on:

NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen

Lumi AI News

Rechtliches

Themenbereiche