WARP rekonstruiert die Trainingsquellen-Mischungen von Sprachmodellen aus ihren Gewichten und erreicht dabei mittlere absolute Fehler von 0,046 bei BERT und 0,104 bei GPT-2.
Eine systematische Daten-Kurierungs-Pipeline ermöglicht es, Agentic-Modelle über vielfältige Aufgabentypen generalisierbar zu trainieren und dabei konkurrenzfähige oder bessere Ergebnisse zu erzielen als spezialisierte Modelle.