OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen

26. Juni 20264. Juli 2026
AI Models

KI-Agenten geben weniger oft nicht existierende Quellen an, verlinken aber in 15,9% der Fälle auf falsche Papers, und stoppen bei schwierigen Fragen die Tool-Nutzung genau dort, wo diese am kritischsten wäre.

Share on:

OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen

Lumi AI News

Rechtliches

Themenbereiche