NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen24. Juni 20264. Juli 2026AI ModelsKI-Agenten übertreffen Baseline auf nur knapp 18 Prozent echter wissenschaftlicher Aufgaben, weil sie Probleme eher neu rahmen als wirklich innovativ lösen. Share on: