Auf den Punkt: Multi-Agent-Koordination mit Task-Dekomposition und Parallelisierung verbessert Computernutzungs-Agenten erheblich und löst komplexe Langzeit-Aufgaben, an denen Einzelagenten scheitern.
Forscher schlagen vor, Computernutzungs-Agenten nicht länger als Einzelagenten auszuführen, sondern als Multi-Agent-Systeme mit Manager-Modell zu koordinieren. Das erreicht 3,4–25,5 % Verbesserungen bei Desktop- und Web-Navigationsaufgaben.
Gegenwärtig werden Computernutzungs-Agenten (CUAs) überwiegend als einzelne serielle Agenten deployt. Dieses Setup ist für komplexe Langzeit-Aufgaben suboptimal, die von Task-Zerlegung, paralleler Ausführung und kontinuierlicher Neuplanung profitieren würden. Ein Forscherteam argumentiert dafür, stattdessen Multi-Agent-Computernutzungs-Systeme (MACU) zu evaluieren und zu entwickeln.
MACU-Systeme basieren auf einem Manager-Modell, das Computernutzungs-Aufgaben als gerichteten azyklischen Graphen (DAG) zerlegt und dabei Abhängigkeiten sowie Subagenten-Ziele kodiert. Bei jeder Iteration verteilt der Manager parallele CUA-Subagenten zur Ausführung von Knoten an der Ready-Frontier des DAG und überarbeitet den Graph kontinuierlich (fügt Knoten hinzu, streicht sie, oder schreibt sie um), wenn neue Erkenntnisse von Subagenten eintreffen. Das Design behandelt die teilweise beobachtbare Umgebung der Computernutzung als grundsätzliche Herausforderung: Informationen, die nachgelagerte Agenten möglicherweise nicht neu beobachten können, werden durch das Manager- und DAG-Struktur-Design beibehalten und weitergeleitet.
In Evaluationen zeigt MACU konsistente Verbesserungen gegenüber starken Single-Agent-Baselines: 3,4–25,5 % auf Desktop-Benchmarks (OSWorld) sowie Web-Navigations-Benchmarks (Online-Mind2Web, WebTailBench, Odysseys). Das System weist besseres Test-Zeit-Skalierungsverhalten auf und löst komplexe Langzeit-Aufgaben, wo Single-Agent-CUAs steckenbleiben. Auf Odysseys, einem Langzeit-Web-Navigations-Benchmark, verkürzt MACU die durchschnittliche Task-Completion-Wall-Clock-Time um etwa das 1,5-Fache und demonstriert damit die Effizienz bei der Beschleunigung traditionell langsamer CUA-Pipelines.
Die Erkenntnisse deuten darauf hin, dass Multi-Agent-Koordination ein vielversprechender Ansatz zum Skalieren von Computernutzungs-Agenten ist, um diese produktiver und länger arbeiten zu lassen. Code und interaktive Visualisierungen sind öffentlich verfügbar.
Quelle: arxiv.org · Erschienen 31. Mai 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.2.9.