Anthropics Arbor: KI-Agenten führen autonome Forschungszyklen durch11. Juni 202611. Juni 2026AI Models, Claude AIShare on:Arbor koordiniert autonome KI-Agenten über persistente Hypothesenbäume und erzielte auf sechs Forschungsaufgaben 2,5-fach bessere Ergebnisse als Codex und Claude Code. Share on:
Wie Reinforcement-Learning-Umgebungen Trainingsqualität zerstören – praktische Lösungen5. Juni 20265. Juni 2026AI Models, Claude CodeShare on:RL-Umgebungen mit Softwarefehlern (Stale Cache, Reward Hacks, falsche State-Übergänge) erzeugen giftige Trainingsdaten, die Agenten-Training sabotieren – systematische Qualitätsprüfung ist notwendig. Share on: