InternVideo3 ermöglicht Foundation-Modellen, längere Videosequenzen mit iterativem Reasoning und Werkzeugnutzung zu analysieren, ohne dabei in Effizienzprobleme bei der KV-Cache-Verwaltung zu geraten.
NVIDIA automatisiert Workflows in der Physical-AI-Forschung durch neue Agent Skills, die Szenenrekonstruktion, Datengeneration und Policy-Training für autonome Fahrzeuge, Robotik und Vision-AI skalierbar machen.
Kleine persistente Adapter auf gemeinsamen Basismodellen können eine praktikable Infrastruktur für Millionen personalisierter KI-Modelle bilden, wenn Skalierung, Identitätsverwaltung und Serving-Anforderungen systematisch gelöst werden.