Zum Inhalt springen

NVIDIA und Microsoft bauen einheitlichen Stack für Agentic-AI-Deployment auf

Share on:

Auf den Punkt: NVIDIA und Microsoft kombinieren spezialisierte Hardware (RTX Spark, DGX Station für Windows), sichere Runtimes (OpenShell) und Open-Source-Modelle (Nemotron, Cosmos) in einen durchgehenden Stack für Agentic-AI-Deployment von lokalen Windows-Devices bis Azure Cloud.

NVIDIA und Microsoft erweitern ihre Partnerschaft um eine durchgehende Infrastruktur für agentenbasierte KI-Systeme: von lokal auf Windows-Geräten über GPU-beschleunigte Enterprise-Workstations bis hin zu Azure-Cloud-Deployments. Die neue Architektur adressiert die spezifischen Anforderungen von Long-Running-Agents mit dedizierten Hardware-, Runtime- und Modell-Komponenten.

Das Agentic-AI-Deployment erfordert mehr als nur leistungsstarke Modelle: Es braucht spezialisierte Hardware, sichere Runtime-Umgebungen, hochperformante Datenschichten und für längere Abläufe optimierte Modelle. NVIDIA und Microsoft bringen diesen kompletten Stack über drei Ebenen zusammen — Windows-Geräte, Azure-Cloud und lokale Infrastruktur.

Auf Windows-Seite führt NVIDIA zwei neue Produktlinien ein: RTX Spark sind die ersten Windows-PCs speziell für persönliche Agents, mit 1 Petaflop KI-Performance, bis zu 128 GB einheitlichem Speicher und Ganztags-Batterielaufzeit. Mehrere Hersteller (Microsoft Surface, ASUS, Dell, HP, Lenovo, MSI) bringen solche Geräte im Herbst auf den Markt. Für Enterprise-Anwendungen folgt DGX Station für Windows als deskside AI Supercomputer mit dem NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip — bis zu 748 GB kohärenter Speicher und 20 Petaflops FP4-Performance ermöglichen die Ausführung von Frontier-Modellen mit bis zu 1 Billion Parametern. Diese Systeme werden ab Q4 von ASUS, Dell, GIGABYTE, HP, MSI und Supermicro verfügbar sein. Beide Produktlinien nutzen NVIDIA OpenShell, eine für autonome Agents ausgestaltete sichere Runtime.

Für Azure-Deployments ergänzt NVIDIA sein Open-Model-Portfolio auf Microsoft Foundry: Nemotron 3 Ultra ist ein neues Open-Frontier-Reasoning-Modell für langfristige Agent-Workflows in Coding, Research und Enterprise-Anwendungen (verfügbar ab diesem Monat auf Foundry Managed Compute). Anthropic Claude läuft nativ auf Azure-Systemen mit GB300 Blackwell Ultra. Das Portfolio erweitert sich um NVIDIA Cosmos 3, ein vollständig offenes Multimodal-Modell für Physical AI mit Vision Reasoning, World Simulation und Action Generation, sowie die NVIDIA Earth-2 AI Weather-Modelle für Enterprise-Forecasting über Microsoft Planetary Computer Pro.

Für die Datenschicht beschleunigt NVIDIA jetzt Microsoft Fabric Data Warehouse durch integrierte accelerated computing — ein Schritt, der für Agent-Systeme kritisch ist, die auf schnellen Datenzugriff angewiesen sind. Damit adressiert die Partnerschaft ein häufiges Bottleneck bei produktiven Agentic-AI-Systemen im Enterprise.


Quelle: blogs.nvidia.com · Erschienen 2. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.2.9.

Share on: