Auf den Punkt: Der Fokus verlagert sich von isolierten KI-Modellen über Agent-Harnesses hin zu Feedback-Schleifen als Kernprodukt, wobei die Gestaltung von Signalen und Bewertungsmechanismen entscheidend ist, damit Agenten ohne ständige menschliche Bottlenecks handeln können.

Das Startup Introspection, gegründet von ehemaligen xAI-Mitarbeitern, baut Infrastruktur für selbstverbessernde KI-Agenten auf. Im Kern steht die Idee von Feedback-Schleifen, in denen Agenten das System selbst warten und optimieren, statt nur externe Tasks auszuführen.

Roland Gavrilescu, Co-Gründer und CEO von Introspection, präsentierte auf der AI Engineer World’s Fair ein neues Konzept: Autoresearch als äußere Schleife, in der Agenten das primäre System selbst warten und verbessern. Dabei nutzen sie Feedback-Signale, automatisierte Evaluationen und menschliches Input als Treiber für kontinuierliche Verbesserung. Gavrilescu und sein Co-Gründer Julian Bright waren zuvor bei xAI tätig, wo sie an Agent-Infrastruktur und Cloud-Agenten arbeiteten. Sie erkannten ein neues Agent-Anwendungsmuster, das bei xAI nicht vollständig verfolgt werden konnte, und gründeten Introspection, um dafür spezialisierte Tools zu schaffen.

Gavrilescu skizziert drei Kernmuster für produktive Autoresearch-Systeme: Erstens wird die Rückkopplungsschleife selbst zum Produkt – nicht die zugrunde liegende KI-Architektur. Damit Agenten mehr Aufgaben übernehmen, ohne qualitativ schlechter Output zu erzeugen (sogenannten „Slop“), müssen die richtigen Feedback-Mechanismen definiert sein. Zweitens führt Introspection das Konzept der Agent-Rezepte ein – ein Format, das wie eine Übersetzung von Datenrezepten aus dem KI-Training funktioniert. Eine Agent-Rezept dokumentiert, wie ein Harness mit verschiedenen Modellen arbeitet, welche Evaluationen durchgeführt werden, welche automatisierten Richter-Systeme existieren und welches menschliche Wissen kodifiziert wurde. Dieses Format soll anbieter-neutral und portabel sein, ähnlich einem Research-Labor, das der Betreiber selbst kontrolliert.

Als drittes Muster identifiziert Gavrilescu die Frage nach dem Optimierungsziel: Wie kann ein System gleichzeitig leistungsfähiger und kostengünstiger werden? Unternehmen wie Cursor und Cognition hätten bereits bewiesen, dass solche Produkte funktionieren. Der nächste Schritt sei, sie zugänglicher, schneller und günstiger zu machen – also Fähigkeiten von Frontier-Modellen graduell in Systeme zu destillieren, die ein Unternehmen selbst kontrolliert und für seine spezifische Umgebung optimieren kann. Dabei bleibt die zentrale Herausforderung: Agenten müssen zunächst von Menschen lernen, bevor sie autonom verbessernde Entscheidungen treffen können.

Quelle: www.latent.space · Erschienen 2. Juli 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.

Share on:

Autoresearch: Der Kreislauf selbstverbessernder Agenten

Lumi AI News

Rechtliches

Themenbereiche