Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.
Context Engineering ist die Disziplin, das Kontextfenster von Sprachmodellen systematisch und zur Laufzeit mit den richtigen Informationen in optimaler Form zu füllen – deutlich umfassender als Prompt Engineering.
Anthropic führt ein Leistungs-Klassifizierungssystem für Claude-Integratoren ein, das nachgewiesene Produktivkunden, zertifiziertes Personal und veröffentlichte Erfolgsbeispiele misst, statt auf Firmengröße zu abstrahieren.
PaW trainiert Umweltmodelle während des Policy-Trainings anhand derselben RL-Rollouts, was die Agent-Performance konsistent verbessert, ohne zusätzliche Simulatoren oder Inference-Kosten zu benötigen.
Angreifer missbrauchen Chat-Sharing-Funktionen von ChatGPT und Claude, um täuschend echte Ausfallseiten zu rendern und Malware über vertrauenswürdige Domains zu verteilen, die konventionelle Sicherheitsfilter passieren.
KPMG rollt Claude unternehmensübergreifend an 276.000 Mitarbeiter:innen aus und baut die Technologie in seine Digital-Gateway-Plattform ein, um Arbeitsprozesse in Steuern, Recht und Cybersecurity zu automatisieren.
Aktuelle Frontier-Modelle erreichen auf dem neuen ITBench-AA-Benchmark zur Bewertung agentischer IT-Fähigkeiten nicht einmal 50 Prozent Erfolgsquote, was einen erheblichen Gap zwischen Modellfähigkeiten und Produktionsreife bei autonomen IT-Aufgaben aufzeigt.