Zum Inhalt springen

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

Share on:

Auf den Punkt: Agentenbasiertes Reasoning verbessert die Regelanwendung in Sprachmodellen, zeigt aber stark unterschiedliche Ergebnisse je nach Modellstärke und Aufgabentyp.

Forscher präsentieren Deontic Agentic Reasoning (DAR), eine Methode, bei der Sprachmodelle als Agenten mit expliziten Regelwerken interagieren, um komplexe juristische und normative Fragen zu beantworten. Tests zeigen Verbesserungen, aber mit stark modellabhängigen Ergebnissen und erhöhtem Token-Verbrauch bei schwächeren Systemen.

Deontisches Reasoning — das Anwenden von expliziten Regeln und Richtlinien auf konkrete Fälle — ist zentral für Anwendungen wie Steuerberechnungen nach Gesetzen oder Entscheidungen in Einwanderungsverfahren. Das Kernproblem: Wenn Regelwerke umfangreich und untereinander referenziert sind, scheitern Sprachmodelle häufig daran, die für einen Reasoning-Schritt erforderlichen Regeln zu lokalisieren.

Die Arbeit führt DAR als agentenbasierte Architektur ein, in der das Modell wie ein Agentensystem mit Statuten und Regelsammlungen on-demand interagiert — ähnlich einem Rechtsanwalt, der bei Bedarf in Gesetztexten nachschlägt. Dies ersetzt den klassischen Ansatz, alle Regeln ins Kontext-Fenster zu laden. Evaluiert wurde DAR auf schwierigen Subsets des DeonticBench-Benchmarks unter verschiedenen Agentenarchitekturen.

Die Ergebnisse sind differenziert: Agentenbasierte Harnesses erweitern die Leistungsgrenzen bei deontischen Aufgaben, aber nicht gleichmäßig. Schwächere Modelle verschlechtern sich oft bei numerischen Aufgaben, während sie gleichzeitig deutlich mehr Token konsumieren. Stärkere Modelle profitieren konsistenter vom Agentenframework. Für CTOs bedeutet dies, dass agentenbasiertes Reasoning für komplexe Regelanwendung vielversprechend ist, aber eine sorgfältige Modellauswahl und Token-Budget-Planung erfordert.


Quelle: arxiv.org · Erschienen 2. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.2.9.

Share on: