Zum Inhalt springen

RISE: Agentic Search mit optimiertem Retrieval statt unbegrenzter Corpus-Interaktion

Share on:

Auf den Punkt: RISE erreicht mit einem begrenzten Interaktionsraum ähnliche Genauigkeit wie unbegrenzte Shell-Interaktion, reduziert aber die Anfragen-Kosten auf etwa ein Viertel und skaliert deutlich besser auf große Korpora.

Forscher schlagen ein Retrieval-System vor, das für agentenbasierte Suche statt direkter Shell-Befehle über den gesamten Corpus ein begrenzt durchsuchbares Interaktionsfeld aufbaut. Das Verfahren RISE nutzt BM25-Ranking und dokumentenspezifische Indexierung, um Latenz und Kosten stark zu senken.

Aktuelle agentenbasierte Suchsysteme übernehmen noch immer das Paradigma der klassischen Informationsbeschaffung: Ein Retriever rankt den Dokumentbestand und der Agent liest eine kleine Menge zurückgegebener Dokumente. Neuere Ansätze zur direkten Corpus-Interaktion (Direct Corpus Interaction, DCI) zeigen jedoch, dass Agenten stattdessen über Shell-Tools wie grep und Dateileser direkt mit dem Rohbestand interagieren können. Dieses Modell hat aber ein entscheidendes Skalierungsproblem: Jeder breite Shell-Befehl führt zu einem Scan über den gesamten Corpus, die Latenzen wachsen rapide mit der Corpus-Größe.

Die Forscher argumentieren, dass Retrieval für agentenbasierte Suche nicht nur Dokumente auswählen sollte, die ins LLM-Kontextfenster passen, sondern einen begrenzt erkundbaren Interaktionsraum konstruieren muss – eine Teilmenge des Corpus mit zugehörigen Explorations-Tools. Nach diesem Konzept wird die Grenze dieses Raums durch Retrieval gezogen, und die Objekte darin sind für Navigation optimiert. Das Proof-of-Concept-System RISE nutzt BM25 zum Aufbau des Interaktionsraums; die darin enthaltenen Dokumente werden bereits bei der Indexierung für Shell-ähnliche Navigation vorbereitet.

Auf dem BrowseComp-Plus-Benchmark erreicht RISE mit gpt-4-mini eine Genauigkeit von 78 Prozent bei etwa einem Viertel der Anfragen-Kosten des reinen Shell-DCI-Ansatzes. Bei einem Corpus von einer Million Dokumenten kommt RISE mit BM25 und gpt-4-mini auf 81 Prozent Genauigkeit, während der DCI-Baseline mit gpt-4-nano auf 60 Prozent fällt und dabei 33 von 100 Anfragen innerhalb des Zeitbudgets scheitern.


Quelle: arxiv.org · Erschienen 4. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.6.5.

Share on: