OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen26. Juni 20264. Juli 2026AI ModelsKI-Agenten geben weniger oft nicht existierende Quellen an, verlinken aber in 15,9% der Fälle auf falsche Papers, und stoppen bei schwierigen Fragen die Tool-Nutzung genau dort, wo diese am kritischsten wäre. Share on: